Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Matcha-TTS는 조건부 플로우 매칭(Conditional Flow Matching)을 활용한 비자기회귀(non-autoregressive) 음성 합성 모델로, ICASSP 2024에서 발표된 연구를 오픈소스로 구현한 프로젝트입니다. ODE 기반 합성 방식 덕분에 적은 단계로도 높은 품질의 자연스러운 음성을 생성할 수 있으며 메모리 사용량이 작아 임베디드 환경에도 적합합니다. ONNX 익스포트와 추론을 지원하며, CLI·Gradio 인터페이스·Jupyter 노트북 등 다양한 사용 환경을 제공합니다. 사전 학습 모델 자동 다운로드, 음소 정렬 추출, 멀티 GPU 학습 기능까지 갖추고 있어 연구자가 자체 데이터셋으로 TTS를 학습시키기에 좋은 출발점이 됩니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현