Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Canopy AI가 개발한 Llama-3b 기반 차세대 오픈소스 TTS 시스템입니다. LLM의 언어 이해 능력을 음성 합성에 활용하여 인간과 거의 구분할 수 없는 자연스러운 억양과 감정 표현을 구현합니다. 파인튜닝 없이 제로샷 음성 클로닝이 가능하며, 간단한 태그로 감정과 억양을 제어할 수 있습니다. 스트리밍 모드에서 약 200ms의 초저지연을 달성하며, 최적화 시 100ms까지 단축 가능합니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현