Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
OuteTTS는 대규모 언어 모델(LLM) 백본을 활용해 텍스트를 음성으로 변환하는 오픈소스 TTS 인터페이스입니다. 음성을 토큰 형태로 다루는 방식을 채택해 별도의 복잡한 음향 모델 없이 LLM만으로 자연스러운 발화를 생성하며, 짧은 참조 음성을 이용한 제로샷 보이스 클로닝과 다국어 음성 합성을 지원합니다. llama.cpp, Hugging Face Transformers, ExLlamaV2 등 다양한 백엔드와 GGUF 양자화 모델을 지원해 로컬 환경에서도 가볍게 실행할 수 있습니다. 통일된 파이썬 인터페이스로 여러 버전의 OuteTTS 모델을 손쉽게 다룰 수 있어 개발자 친화적인 음성 합성 도구입니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현