Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
파이어레드팀에서 개발한 산업급 음성인식 모델. 중국어(만다린, 방언), 영어, 노래 가사 인식을 지원하며 중국어 벤치마크에서 최신 성능을 달성했습니다. Encoder-Decoder와 LLM 통합의 두 가지 모델 변형을 제공하여 성능과 효율성의 균형을 맞춥니다.
ggml-org
OpenAI Whisper의 C/C++ 포팅 - 로컬 STT의 사실상 표준

microsoft
60분 음성 단일 패스 처리 보이스 AI
m-bain
단어 수준 타임스탬프와 화자 분리를 지원하는 70배 빠른 Whisper 기반 ASR 라이브러리

SYSTRAN
CTranslate2 기반 Whisper 4배 고속 음성 인식 라이브러리