Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
ComfyUI 확장으로 600개 이상의 언어를 지원하는 제로샷 다국어 음성 합성 플러그인. 음성 클로닝(3-15초 참고음성), 음성 디자인(성별/나이/음정/억양 텍스트 설명), 멀티스피커 대화([Speaker_N]: 태그), [웃음], [한숨] 등 비언어적 표현 지원. RTF 0.025(40배 실시간)의 고속 추론, SageAttention GPU 최적화, HuggingFace 자동 모델 다운로드, CPU 오프로딩 지원.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현