Trending

FunASR

modelscopeMIT2026.02.11

STT14.9K Stars1.6K Forks6.8천 조회

FunASR는 ModelScope에서 개발한 종합 음성 인식 툴킷으로, ASR, VAD, 구두점 복원, 화자 인식 등 다양한 음성 처리 기능을 제공합니다. 최신 Fun-ASR-Nano 모델은 수천만 시간의 실제 음성 데이터로 학습되어 31개 언어를 지원하며, 저지연 실시간 전사가 가능합니다. 교육, 금융 등 전문 도메인의 용어도 정확하게 인식합니다.

주요 특징

ASR, VAD, 구두점 복원, 화자 분리 등 종합 음성 처리
31개 언어 및 7개 중국어 방언 지원
스트리밍/비스트리밍 인식 모드 모두 지원
수천만 시간 실제 음성 데이터 학습
CLI 및 Python API 제공, pip 설치 지원

Open Source

FunASR

주요 특징

태그

관련 프로젝트

whisper.cpp

VibeVoice

WhisperX

faster-whisper