Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

Moonshine은 엣지 디바이스를 위한 초고속 자동 음성 인식(ASR) 모델입니다. Whisper 대비 5~15배 빠른 처리 속도를 자랑하면서도 동등하거나 더 나은 정확도를 유지합니다. Tiny 모델(27M)과 Base 모델(62M)의 초경량 파라미터로 모바일/IoT 디바이스에서도 원활하게 동작하며, 입력 오디오 길이에 비례하는 연산 스케일링으로 짧은 음성일수록 극도로 빠릅니다. 영어를 포함해 한국어 등 7개 이상의 언어를 지원합니다.

microsoft
60분 음성 단일 패스 처리 보이스 AI

SYSTRAN
CTranslate2 기반 Whisper 4배 고속 음성 인식 라이브러리
cjpais
개인정보 보호형 로컬 음성인식 데스크톱 앱
NVIDIA-NeMo
NVIDIA의 엔터프라이즈급 생성형 AI 프레임워크 - ASR, LLM, TTS 통합