Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

faster-whisper는 SYSTRAN이 개발한 고성능 음성 인식 라이브러리로, OpenAI Whisper 모델을 CTranslate2 엔진으로 재구현했습니다. 원본 대비 최대 4배 빠른 전사 속도를 제공하면서 동일한 정확도를 유지합니다. CPU/GPU에서 8비트 양자화를 지원해 메모리 효율을 높이고, 단어 수준 타임스탬프, VAD 필터링, 배치 처리 등 고급 전사 기능을 제공합니다. distil-large-v3를 포함한 다양한 모델을 지원합니다.

microsoft
60분 음성 단일 패스 처리 보이스 AI
cjpais
개인정보 보호형 로컬 음성인식 데스크톱 앱
NVIDIA-NeMo
NVIDIA의 엔터프라이즈급 생성형 AI 프레임워크 - ASR, LLM, TTS 통합

modelscope
31개 언어 지원 산업용 종합 음성 인식(ASR) 툴킷