Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Tauri 기반 크로스플랫폼 데스크톱 음성인식 애플리케이션입니다. 키보드 단축키로 음성 입력을 시작하면 텍스트가 자동으로 입력되며, 모든 처리가 로컬에서 이루어져 클라우드 없이 개인정보를 보호합니다. Whisper/Parakeet V3 모델 선택, GPU 가속(NVIDIA/AMD/Intel) 지원, Silero VAD 음성 감지, 다국어 자동 감지 등의 기능을 갖추고 있으며 macOS, Windows, Linux를 지원합니다.

microsoft
60분 음성 단일 패스 처리 보이스 AI

SYSTRAN
CTranslate2 기반 Whisper 4배 고속 음성 인식 라이브러리
NVIDIA-NeMo
NVIDIA의 엔터프라이즈급 생성형 AI 프레임워크 - ASR, LLM, TTS 통합

modelscope
31개 언어 지원 산업용 종합 음성 인식(ASR) 툴킷