Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
RVC(Retrieval-based-Voice-Conversion-WebUI)는 10분 이하의 짧은 음성 데이터만으로도 품질 좋은 음성 변환(Voice Conversion) 모델을 학습할 수 있는 오픈소스 도구다. VITS 기반 구조에 retrieval(검색) 기법을 결합해 학습 데이터의 음색 특징을 추론 단계에서 직접 참조함으로써, 적은 데이터로도 톤 누출을 줄이고 대상 화자의 음색을 안정적으로 재현한다. 웹 UI를 통해 데이터 전처리, 학습, 추론, 실시간 변환을 GUI에서 처리할 수 있어 비전문가도 접근하기 쉽다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
RVC-Project
10분 음성으로 학습하는 검색 기반 음성 변환 웹 UI