Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
차세대 Kaldi 프로젝트 기반의 오프라인 음성인식 프레임워크로, 인터넷 연결 없이 STT, TTS, 화자 분리, 음성 향상 등 다양한 음성 처리 기능을 제공합니다. ONNX Runtime을 활용하여 Android, iOS, HarmonyOS, Raspberry Pi, RISC-V 등 임베디드 시스템부터 x86 서버까지 폭넓은 플랫폼을 지원하며, C++, Python, Java, C# 등 12개 프로그래밍 언어 바인딩을 제공합니다. 웹소켓 서버/클라이언트 지원으로 실시간 스트리밍 음성인식도 가능합니다.
ggml-org
OpenAI Whisper의 C/C++ 포팅 - 로컬 STT의 사실상 표준

microsoft
60분 음성 단일 패스 처리 보이스 AI
m-bain
단어 수준 타임스탬프와 화자 분리를 지원하는 70배 빠른 Whisper 기반 ASR 라이브러리

SYSTRAN
CTranslate2 기반 Whisper 4배 고속 음성 인식 라이브러리