Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
IMS-Toucan은 슈투트가르트 대학 자연어처리 연구소(IMS)에서 개발한 다국어 텍스트 음성 합성 툴킷으로, 무려 7,000개 이상의 언어를 지원하는 것이 가장 큰 특징입니다. 거대한 컴퓨팅 자원 없이도 빠른 추론이 가능하도록 설계되어 연구자와 교육 현장에서 폭넓게 활용되고 있습니다. 운율 복제(prosody cloning), 스피커 임베딩 제어 기능을 통해 화자별 스타일을 세밀하게 조절할 수 있으며, Hugging Face에서 사전 학습된 모델을 바로 받아 사용할 수 있습니다. 인터랙티브 데모와 GUI 인터페이스를 제공하고 커스텀 모델 학습 파이프라인까지 갖추고 있어 저자원 언어 TTS 연구에 특히 강점을 보입니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현