TrendingFeatured

Chatterbox

resemble-aiMIT2026.02.09

TTS22.5K Stars2.9K Forks6.9천 조회

Chatterbox는 Resemble AI에서 개발한 최첨단 오픈소스 TTS(텍스트-음성 변환) 모델입니다. Chatterbox-Turbo(350M 파라미터)는 경량 고속 음성 합성을, Chatterbox-Multilingual(500M)은 23개 이상 언어에서 제로샷 음성 복제를 지원합니다. 멜 디코더 단계를 10에서 1로 축소하는 혁신적 아키텍처를 채택했으며, 비언어 음성 태그([laugh], [cough])와 Perth 워터마킹을 통한 생성 음성 인증 기능을 제공합니다. pip install로 간편하게 설치할 수 있습니다.

주요 특징

Chatterbox-Turbo: 350M 파라미터 경량 고속 TTS
Chatterbox-Multilingual: 23개+ 언어 제로샷 음성 복제
비언어 음성 태그([laugh], [cough]) 지원
Perth 워터마킹으로 생성 음성 인증
CFG 및 과장(Exaggeration) 튜닝
pip install로 간편 설치
멜 디코더 단계 10→1 축소 아키텍처

Open Source

Chatterbox

주요 특징

태그

관련 프로젝트

Real-Time-Voice-Cloning

GPT-SoVITS

ChatTTS

OpenVoice