Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Parakeet MLX는 NVIDIA Parakeet TDT 음성 인식 모델을 Apple의 MLX 프레임워크로 포팅한 오픈소스 프로젝트입니다. Apple Silicon(M1/M2/M3/M4)의 통합 메모리와 Metal GPU를 활용해 0.6B 파라미터 Parakeet 모델을 CPU 대비 압도적으로 빠른 속도로 구동하며, Whisper Large v3 turbo를 능가하는 정확도와 처리량을 로컬 환경에서 제공합니다. CLI 한 줄로 오디오 파일을 자막(SRT/VTT) 또는 텍스트로 변환할 수 있어 Mac 사용자의 로컬 ASR 워크플로우에 최적화되어 있습니다.
ggml-org
OpenAI Whisper의 C/C++ 포팅 - 로컬 STT의 사실상 표준

microsoft
60분 음성 단일 패스 처리 보이스 AI
m-bain
단어 수준 타임스탬프와 화자 분리를 지원하는 70배 빠른 Whisper 기반 ASR 라이브러리

SYSTRAN
CTranslate2 기반 Whisper 4배 고속 음성 인식 라이브러리