Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
적은 양의 음성 데이터만으로도 고품질 음성 변환(Voice Conversion) 모델을 손쉽게 학습할 수 있는 오픈소스 웹 UI 프로젝트입니다. 검색(Retrieval) 기반 특징 매칭 기법을 도입해 10분 내외의 짧은 음성 샘플로도 음색 누수를 최소화한 자연스러운 변환 결과를 얻을 수 있습니다. 직관적인 웹 인터페이스를 통해 데이터 전처리, 모델 학습, 실시간 추론을 비전문가도 진행할 수 있으며, 노래 커버 제작·더빙·음성 캐릭터 구현 등 다양한 창작 작업에 폭넓게 활용되고 있습니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함