Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

IndexTTS는 산업 수준의 제어 가능하고 효율적인 제로샷 텍스트 음성 변환(TTS) 시스템입니다. 짧은 오디오 프롬프트만으로 화자의 음색, 악센트, 감정, 리듬을 복제하며, 텍스트 설명을 통한 감정 표현 제어와 정밀한 발화 속도 조절이 가능합니다. IndexTTS2에서는 자동 회귀 생성 모드를 도입해 더욱 자연스러운 음성 합성을 구현했으며, FP16과 DeepSpeed 지원으로 빠른 추론 속도를 제공합니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현