Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

Pocket TTS는 Kyutai가 개발한 초경량 텍스트-음성 변환(TTS) 모델로, 단 100M 파라미터로 CPU 환경에서 실시간 음성 합성이 가능합니다. Apple Silicon MacBook Air M4에서 실시간 대비 6배 빠른 속도를 보여주며, 약 200ms의 낮은 지연 시간으로 오디오 스트리밍을 지원합니다. GPU 없이 pip install 한 줄로 설치할 수 있으며, 음성 복제(voice cloning) 기능도 탑재하고 있습니다. 출시 3일 만에 1K Stars를 돌파한 급성장 프로젝트입니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현