Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Coqui TTS는 음성 합성을 위한 심층 학습 도구 모음으로, 연구 및 프로덕션 환경에서 검증된 오픈소스 프로젝트입니다. 1100개 이상의 언어를 지원하며 XTTS, VITS 등 다양한 고급 모델을 포함합니다. 음성 복제, 변환 기능과 다중 언어/다중 화자 지원으로 자유로운 음성 애플리케이션 개발이 가능합니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델