Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Tauri 기반 크로스플랫폼 데스크톱 음성인식 애플리케이션입니다. 키보드 단축키로 음성 입력을 시작하면 텍스트가 자동으로 입력되며, 모든 처리가 로컬에서 이루어져 클라우드 없이 개인정보를 보호합니다. Whisper/Parakeet V3 모델 선택, GPU 가속(NVIDIA/AMD/Intel) 지원, Silero VAD 음성 감지, 다국어 자동 감지 등의 기능을 갖추고 있으며 macOS, Windows, Linux를 지원합니다.
ggml-org
OpenAI Whisper의 C/C++ 포팅 - 로컬 STT의 사실상 표준

microsoft
60분 음성 단일 패스 처리 보이스 AI
m-bain
단어 수준 타임스탬프와 화자 분리를 지원하는 70배 빠른 Whisper 기반 ASR 라이브러리

SYSTRAN
CTranslate2 기반 Whisper 4배 고속 음성 인식 라이브러리