Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
TTS-WebUI는 Bark, MusicGen, AudioGen, Tortoise, RVC, CosyVoice, XTTSv2, DIA, Kokoro, OpenVoice, ParlerTTS, Stable Audio, ACE-Step, OmniVoice, Kimi Audio 등 40개 이상의 TTS·오디오 생성 모델을 하나의 통합 인터페이스에서 사용할 수 있는 오픈소스 웹 UI입니다. Gradio 백엔드와 React 프론트엔드를 결합하고, 확장 플러그인 마켓플레이스를 통해 의존성 충돌 없이 신규 모델을 쉽게 추가할 수 있습니다. OpenAI 호환 API 엔드포인트와 Docker 지원으로 프로덕션 배포에도 적합하며, 2026년에도 PyTorch 2.11.0 업그레이드 등 활발히 유지보수되고 있습니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함