Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

Dia는 Nari Labs에서 개발한 1.6B 파라미터의 텍스트-음성 변환(TTS) 모델로, 한 번의 패스로 초현실적인 대화를 생성할 수 있습니다. 다중 화자 대화 생성, 웃음/기침 등 비언어적 소리 합성, 음성 복제 기능을 지원합니다. RTX 4090에서 2.1배 실시간 속도를 달성하며 약 4.4GB VRAM만 필요합니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현