Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

Moonshine은 엣지 디바이스에 최적화된 초고속 자동 음성인식(ASR) 모델입니다. OpenAI Whisper의 30초 고정 입력 제한을 극복하고, 5~35배 빠른 추론 속도를 제공합니다. 온디바이스 처리로 개인정보를 보호하면서도 미디엄 모델 기준 6.65% WER(단어 오류율)의 높은 정확도를 달성합니다. Python, iOS, Android, Linux, Windows, Raspberry Pi 등 다양한 플랫폼을 지원하며, 영어를 포함한 8개 언어를 인식합니다. 실시간 스트리밍 음성인식이 가능해 IoT, 모바일 앱, 접근성 서비스 등에 활용할 수 있습니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델
jamiepine
23개 언어 지원, 다중 TTS 엔진 기반의 로컬 음성 합성 스튜디오