Trending

ClearerVoice-Studio

modelscopeApache-2.02026.02.10

Audio3.9K Stars321 Forks7.1천 조회

ModelScope(알리바바)이 개발한 ClearerVoice-Studio는 AI 기반 음성 처리 올인원 툴킷입니다. 음성 향상(Speech Enhancement), 음성 분리(Speech Separation), 대상 화자 추출(Target Speaker Extraction), 음성 초해상도(Speech Super-Resolution) 등 다양한 음성 처리 기능을 SOTA 수준의 사전 훈련 모델과 함께 제공합니다. PyTorch 기반으로 구현되어 연구자와 개발자 모두 쉽게 활용할 수 있으며, 노이즈 제거, 대역폭 확장, 음성 품질 평가 등 실용적인 기능을 포함하고 있습니다. 특히 MossFormer 아키텍처 기반의 모델들이 여러 벤치마크에서 최고 성능을 기록하고 있습니다.

주요 특징

음성 향상 (노이즈 제거/반향 억제)
음성 분리 (다중 화자 분리)
대상 화자 추출 (특정 화자 음성만 추출)
음성 초해상도 (대역폭 확장)
SOTA 사전 훈련 모델 및 학습 스크립트 제공

Open Source

ClearerVoice-Studio

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)