Trending

Matcha-TTS

shivammehta25MIT2026.05.26

TTS1.3K Stars200 Forks5.1천 조회

Matcha-TTS는 조건부 플로우 매칭(Conditional Flow Matching)을 활용한 비자기회귀(non-autoregressive) 음성 합성 모델로, ICASSP 2024에서 발표된 연구를 오픈소스로 구현한 프로젝트입니다. ODE 기반 합성 방식 덕분에 적은 단계로도 높은 품질의 자연스러운 음성을 생성할 수 있으며 메모리 사용량이 작아 임베디드 환경에도 적합합니다. ONNX 익스포트와 추론을 지원하며, CLI·Gradio 인터페이스·Jupyter 노트북 등 다양한 사용 환경을 제공합니다. 사전 학습 모델 자동 다운로드, 음소 정렬 추출, 멀티 GPU 학습 기능까지 갖추고 있어 연구자가 자체 데이터셋으로 TTS를 학습시키기에 좋은 출발점이 됩니다.

주요 특징

조건부 플로우 매칭 기반 비자기회귀 합성
ODE 기반 빠른 추론과 작은 메모리 사용량
ONNX 익스포트 및 추론 지원
CLI, Gradio, Jupyter 등 다중 인터페이스
음소 정렬 추출과 멀티 GPU 학습 지원

Open Source

Matcha-TTS

주요 특징

태그

관련 프로젝트

Real-Time-Voice-Cloning

GPT-SoVITS

ChatTTS

OpenVoice