Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
MegaTTS3는 바이트댄스가 공개한 경량 고품질 제로샷 음성 합성(TTS) 모델입니다. 비교적 가벼운 파라미터 구조로도 자연스럽고 또렷한 음성을 생성하며, 짧은 참조 음성만으로 화자의 음색을 복제하는 제로샷 보이스 클로닝을 지원합니다. 디퓨전 기반 합성과 함께 외국어 억양의 세기를 사용자가 직접 조절하는 액센트 강도 제어 기능을 제공하고, 중국어·영어 혼합 발화와 발음 편집도 가능합니다. 추론 속도가 빠르고 모델이 가벼워 연구·개인 프로젝트는 물론 음성 더빙, 보이스 어시스턴트 등 실서비스에도 적합한 음성 합성 솔루션입니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현