Trending

Kokoro

hexgradApache-2.02026.04.18

TTS6.6K Stars728 Forks6.9천 조회

Kokoro는 hexgrad가 개발한 82M 파라미터 경량 TTS 모델로, HuggingFace에서 공개된 고품질 오픈소스 음성 합성 프로젝트입니다. StyleTTS2와 ISTFTNet 아키텍처를 기반으로 하며 인코더나 디퓨전 프로세스 없이 빠른 음성 생성이 가능합니다. 소형 모델임에도 대형 상용 TTS에 필적하는 자연스럽고 표현력 있는 음성을 합성하며, Apache 2.0 라이선스로 상업 프로젝트에도 자유롭게 통합할 수 있습니다. 다양한 음성 스타일과 감정 표현을 지원하며 CPU/GPU 모두에서 실시간 이상의 속도로 동작합니다.

주요 특징

82M 파라미터 경량 아키텍처로 빠른 추론 속도
StyleTTS2 기반 고품질 자연스러운 음성 합성
인코더/디퓨전 없이 직접 음성 생성으로 저지연
Apache 2.0 라이선스로 상업 사용 가능
CPU 및 GPU 환경 모두 실시간 이상 속도 지원

Open Source

Kokoro

주요 특징

태그

관련 프로젝트

Real-Time-Voice-Cloning

GPT-SoVITS

ChatTTS

OpenVoice