Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Kyutai Labs에서 개발한 음성-텍스트 변환(STT) 및 텍스트-음성 변환(TTS) 모델로, 지연된 스트림 모델링 기술을 기반으로 합니다. 실시간 스트리밍 처리를 지원하면서도 높은 정확도와 자연스러운 음성 품질을 유지하는 것이 핵심 특징입니다. 다국어 음성 처리, 다양한 음성 스타일 지원, 저지연 처리 등이 가능하며, 현대적인 음성 기술 요구사항을 충족시킵니다. 연구 및 산업 응용을 위해 최적화되어 있으며, 최신 딥러닝 기법을 활용한 고성능 음성 처리를 제공합니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현