Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

FunASR는 ModelScope에서 개발한 종합 음성 인식 툴킷으로, ASR, VAD, 구두점 복원, 화자 인식 등 다양한 음성 처리 기능을 제공합니다. 최신 Fun-ASR-Nano 모델은 수천만 시간의 실제 음성 데이터로 학습되어 31개 언어를 지원하며, 저지연 실시간 전사가 가능합니다. 교육, 금융 등 전문 도메인의 용어도 정확하게 인식합니다.

microsoft
60분 음성 단일 패스 처리 보이스 AI

SYSTRAN
CTranslate2 기반 Whisper 4배 고속 음성 인식 라이브러리
cjpais
개인정보 보호형 로컬 음성인식 데스크톱 앱
NVIDIA-NeMo
NVIDIA의 엔터프라이즈급 생성형 AI 프레임워크 - ASR, LLM, TTS 통합