Trending

Fun-ASR

FunAudioLLMApache-2.02026.03.18

STT3.2K Stars420 Forks7.8천 조회

알리바바 TongYi 랩에서 개발한 엔드-투-엔드 음성인식 모델입니다. 수천만 시간의 실제 음성 데이터로 학습되었으며 31개 언어를 지원하고 저지연 실시간 전사를 가능하게 합니다. 중국 방언 7개 그룹과 26개 지역 억양에 특화되었으며, 원거리 및 고소음 환경(회의실, 차량 등)에서 93% 정확도를 달성합니다.

주요 특징

31개 언어 실시간 음성인식
7개 중국 방언 그룹 + 26개 지역 억양 지원
원거리/고소음 환경 최적화 (93% 정확도)
음악 배경 간섭 처리
교육/금융 등 수직 도메인 특화

Open Source

Fun-ASR

주요 특징

태그

관련 프로젝트

whisper.cpp

VibeVoice

WhisperX

faster-whisper