Trending

SVoice

facebookresearchCC-BY-NC-4.02026.03.29

Audio1.3K Stars188 Forks7.2천 조회

SVoice는 Meta(Facebook) AI Research에서 개발한 음성 분리 모델입니다. 여러 사람이 동시에 말하는 혼합 오디오에서 개별 화자의 음성을 분리하는 게이트 신경망 기반 기술을 구현했습니다. 가장 큰 특징은 화자 수를 사전에 알 수 없는 상황에서도 동작한다는 점으로, 실제 환경에서의 활용성이 높습니다. 다단계 처리 과정에서 각 출력 채널의 화자를 고정적으로 유지하는 방식으로 높은 분리 품질을 달성합니다. 회의 녹음 분리, 화상통화 음성 향상, 음성인식 전처리 등에 활용되며, PyTorch로 구현되어 확장이 용이합니다.

주요 특징

미지 화자 수 환경에서 음성 분리 가능
게이트 신경망 기반 다단계 처리
출력 채널별 화자 고정 유지 기술
PyTorch 기반 확장 용이한 구조
회의록/화상통화 음성 분리에 최적

Open Source

SVoice

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)