Trending

Parler-TTS

huggingfaceApache-2.02026.03.17

TTS5.5K Stars583 Forks7.8천 조회

Parler-TTS는 Hugging Face에서 개발한 고품질 텍스트-투-스피치 추론 및 훈련 라이브러리입니다. 자연어 프롬프트로 화자의 성별, 톤, 억양, 말하기 스타일 등을 자유롭게 제어할 수 있는 것이 핵심 특징입니다. Mini(880M)와 Large(2.3B) 두 가지 모델을 제공하며, 45,000시간의 오디오북 데이터로 훈련되었습니다. 34명의 이름 있는 화자를 지원하여 일관된 음성 재현이 가능하고, Flash Attention 2와 torch.compile 최적화로 빠른 추론 속도를 달성합니다. 훈련 코드, 데이터셋, 모델 가중치가 모두 공개되어 있어 연구 및 상용화에 활용할 수 있습니다.

주요 특징

자연어 프롬프트로 화자 특성 제어 (성별, 톤, 스타일)
Mini(880M)와 Large(2.3B) 두 가지 모델 제공
34명의 이름 있는 화자로 일관된 음성 재현
Flash Attention 2 및 torch.compile 최적화 지원
훈련 코드, 데이터셋, 모델 가중치 전체 공개

Open Source

Parler-TTS

주요 특징

태그

관련 프로젝트

Real-Time-Voice-Cloning

GPT-SoVITS

ChatTTS

OpenVoice