Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
VoxCPM2는 OpenBMB가 개발한 토크나이저 없는(Tokenizer-Free) 텍스트-음성 변환 모델로, 확산 자기회귀(Diffusion Autoregressive) 아키텍처를 기반으로 합니다. 200만 시간 이상의 다국어 음성 데이터로 훈련된 20억 파라미터 모델이며, 언어 태그 없이 30개 언어를 지원합니다. 텍스트 설명만으로 새로운 목소리를 생성하는 Voice Design 기능과 스타일 가이던스를 활용한 음성 복제(Voice Cloning)를 지원하며, 48kHz 스튜디오급 음질과 실시간 스트리밍(RTF ~0.3)을 제공합니다. Apache-2.0 라이선스로 상업적 활용도 가능합니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현