Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Kokoro는 hexgrad에서 개발한 초경량 고품질 텍스트-음성 변환(TTS) 모델입니다. 단 8,200만(82M) 파라미터로 훨씬 큰 모델들과 비견되는 음성 품질을 제공하면서도 빠른 추론 속도와 낮은 비용을 자랑합니다. Apache 2.0 라이선스로 공개되어 상업적 프로젝트와 개인 프로젝트 모두에 자유롭게 사용할 수 있습니다. 영어(미국/영국), 스페인어, 프랑스어, 힌디어, 이탈리아어, 일본어, 포르투갈어, 중국어 등 다양한 언어를 지원하며, CUDA와 Apple Silicon MPS GPU 가속을 지원합니다. pip install로 간편하게 설치할 수 있고, misaki G2P 라이브러리를 활용한 음소 변환, 배치 처리, 음성 속도 조절 등 실용적인 기능을 제공합니다. TTS Spaces Arena에서 1위를 기록한 검증된 모델입니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현