Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Meta 연구팀에서 개발한 개혁적 음성인식 시스템으로 1,600개 이상의 언어를 지원합니다. 500개 이상의 언어를 처음으로 ASR 기술로 커버하며, Zero-Shot 학습으로 새로운 언어를 단 몇 개의 예시로 추가할 수 있습니다. 7B-LLM 모델은 1,600개 언어 전체에서 78%가 10 이하의 문자 오류율을 달성합니다.
ggml-org
OpenAI Whisper의 C/C++ 포팅 - 로컬 STT의 사실상 표준

microsoft
60분 음성 단일 패스 처리 보이스 AI
m-bain
단어 수준 타임스탬프와 화자 분리를 지원하는 70배 빠른 Whisper 기반 ASR 라이브러리

SYSTRAN
CTranslate2 기반 Whisper 4배 고속 음성 인식 라이브러리