Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
음성, 음악, 음향 효과 등 다양한 오디오 데이터를 수집하고 정리한 포괄적인 데이터셋 컬렉션입니다. DISCO-10M 음악 데이터셋, MusicCaps 음악-텍스트 쌍, MusicNet 고전음악 라벨링 데이터 등 생성형 AI 학습에 필요한 고품질 오디오 자료를 제공합니다. 음성 인식, 음성 합성, 음악 정보 검색, 음악 생성 등 다양한 오디오 AI 애플리케이션 개발에 필수적인 데이터셋 리소스입니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델
jamiepine
23개 언어 지원, 다중 TTS 엔진 기반의 로컬 음성 합성 스튜디오