Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Kokoro는 hexgrad가 개발한 82M 파라미터 경량 TTS 모델로, HuggingFace에서 공개된 고품질 오픈소스 음성 합성 프로젝트입니다. StyleTTS2와 ISTFTNet 아키텍처를 기반으로 하며 인코더나 디퓨전 프로세스 없이 빠른 음성 생성이 가능합니다. 소형 모델임에도 대형 상용 TTS에 필적하는 자연스럽고 표현력 있는 음성을 합성하며, Apache 2.0 라이선스로 상업 프로젝트에도 자유롭게 통합할 수 있습니다. 다양한 음성 스타일과 감정 표현을 지원하며 CPU/GPU 모두에서 실시간 이상의 속도로 동작합니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현