Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

Chatterbox는 Resemble AI에서 개발한 최첨단 오픈소스 TTS(텍스트-음성 변환) 모델입니다. Chatterbox-Turbo(350M 파라미터)는 경량 고속 음성 합성을, Chatterbox-Multilingual(500M)은 23개 이상 언어에서 제로샷 음성 복제를 지원합니다. 멜 디코더 단계를 10에서 1로 축소하는 혁신적 아키텍처를 채택했으며, 비언어 음성 태그([laugh], [cough])와 Perth 워터마킹을 통한 생성 음성 인증 기능을 제공합니다. pip install로 간편하게 설치할 수 있습니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현