Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Parler-TTS는 Hugging Face에서 개발한 고품질 텍스트-투-스피치 추론 및 훈련 라이브러리입니다. 자연어 프롬프트로 화자의 성별, 톤, 억양, 말하기 스타일 등을 자유롭게 제어할 수 있는 것이 핵심 특징입니다. Mini(880M)와 Large(2.3B) 두 가지 모델을 제공하며, 45,000시간의 오디오북 데이터로 훈련되었습니다. 34명의 이름 있는 화자를 지원하여 일관된 음성 재현이 가능하고, Flash Attention 2와 torch.compile 최적화로 빠른 추론 속도를 달성합니다. 훈련 코드, 데이터셋, 모델 가중치가 모두 공개되어 있어 연구 및 상용화에 활용할 수 있습니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현