Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
ONNX 기반의 초고속 온디바이스 다국어 텍스트음성 합성(TTS) 시스템입니다. 66M 파라미터만으로 실시간 재생 속도 대비 167배 빠른 성능을 달성하며, 클라우드 API 의존 없이 완전히 로컬에서 실행됩니다. 영어, 한국어, 스페인어, 포르투갈어, 프랑스어를 지원하며 11개 이상의 프로그래밍 언어로 통합 가능합니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함