Trending

Kokoro

hexgradApache-2.02026.03.10

TTS5.9K Stars671 Forks8.3천 조회

Kokoro는 hexgrad에서 개발한 초경량 고품질 텍스트-음성 변환(TTS) 모델입니다. 단 8,200만(82M) 파라미터로 훨씬 큰 모델들과 비견되는 음성 품질을 제공하면서도 빠른 추론 속도와 낮은 비용을 자랑합니다. Apache 2.0 라이선스로 공개되어 상업적 프로젝트와 개인 프로젝트 모두에 자유롭게 사용할 수 있습니다. 영어(미국/영국), 스페인어, 프랑스어, 힌디어, 이탈리아어, 일본어, 포르투갈어, 중국어 등 다양한 언어를 지원하며, CUDA와 Apple Silicon MPS GPU 가속을 지원합니다. pip install로 간편하게 설치할 수 있고, misaki G2P 라이브러리를 활용한 음소 변환, 배치 처리, 음성 속도 조절 등 실용적인 기능을 제공합니다. TTS Spaces Arena에서 1위를 기록한 검증된 모델입니다.

주요 특징

82M 파라미터 초경량 모델로 대형 모델급 품질 달성
9개 언어 지원 (영어, 스페인어, 프랑스어, 일본어, 중국어 등)
CUDA 및 Apple Silicon MPS GPU 가속 지원
pip install로 간편 설치 및 배치 처리 지원
Apache 2.0 라이선스로 상업적 사용 가능

Open Source

Kokoro

주요 특징

태그

관련 프로젝트

Real-Time-Voice-Cloning

GPT-SoVITS

ChatTTS

OpenVoice