Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
MIT와 MyShell이 개발한 인스턴트 목소리 복제 오디오 기반 모델입니다. 정확한 톤 컬러 복제, 세밀한 음성 스타일 제어(감정, 억양, 리듬, 강조), 제로샷 크로스링귀얼 목소리 복제를 지원합니다. V2는 2024년 4월 업그레이드되어 더 높은 오디오 품질 제공. 영어, 스페인어, 프랑스어, 중국어, 일본어, 한국어 네이티브 지원.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
fishaudio
TTS-Arena2 1위, 감정 풍부한 다국어 음성 합성 및 제로샷 음성 복제 모델