Trending

SpeechBrain

speechbrainApache-2.02026.03.10

STT11.3K Stars1.7K Forks8.2천 조회

SpeechBrain은 PyTorch 기반의 오픈소스 대화형 AI 툴킷으로, 음성 인식(ASR), 화자 인식, 음성 향상, 음성 분리, 텍스트-음성 변환(TTS), 언어 모델링, 대화 시스템 등 음성 및 텍스트 처리의 거의 모든 영역을 포괄합니다. 140명 이상의 개발자가 기여하고 있으며, PyPI에서 월 20만 회 이상의 다운로드를 기록하고 있습니다. 사전 학습된 모델과 레시피를 통해 연구자와 개발자 모두 빠르게 최신 음성 처리 시스템을 구축할 수 있으며, HuggingFace Hub과 긴밀하게 통합되어 모델 공유와 배포가 용이합니다. 음성 어시스턴트, 챗봇, 회의 전사 등 다양한 실무 애플리케이션에 활용할 수 있는 포괄적인 프레임워크입니다.

주요 특징

음성 인식, 화자 인식, 음성 향상, 음성 분리 등 올인원 지원
HuggingFace Hub 통합으로 사전학습 모델 즉시 활용 가능
140명 이상 개발자 기여, 월 20만 다운로드의 활발한 커뮤니티
Conformer, Transformer 등 최신 아키텍처 기반 레시피 제공
음성 어시스턴트, 챗봇, 회의 전사 등 실무 애플리케이션 구축 지원

Open Source

SpeechBrain

주요 특징

태그

관련 프로젝트

whisper.cpp

VibeVoice

WhisperX

faster-whisper