Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
KittenTTS는 모델 용량이 25MB 미만인 초경량 오픈소스 텍스트-음성 변환(TTS) 모델입니다. 매우 작은 파라미터 크기에도 또렷하고 자연스러운 음성을 생성하며, 별도의 GPU 없이 CPU만으로도 빠르게 동작하도록 설계되어 라즈베리 파이 같은 저사양 기기나 엣지 환경에서도 실시간에 가까운 음성 합성이 가능합니다. 여러 종류의 사전 학습 음성(보이스)을 제공하며, 파이썬 패키지로 손쉽게 설치해 몇 줄의 코드만으로 음성을 생성할 수 있습니다. 온디바이스 음성 비서, 임베디드 기기, 경량 애플리케이션 등 자원이 제한된 환경에 특히 적합한 TTS 모델입니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현