Trending

Silero Models

snakers4MIT2026.04.11

STT5.5K Stars346 Forks7.6천 조회

Silero Models는 기업 수준의 사전 훈련된 음성-텍스트(STT), 텍스트-음성(TTS), 텍스트 향상 모델을 제공하는 오픈소스 프로젝트입니다. PyTorch Hub를 통해 단 몇 줄의 코드로 사용할 수 있도록 설계되었으며, Google STT에 버금가는 인식 품질을 제공합니다. 영어, 독일어, 스페인어, 러시아어 등 다국어를 지원하며, 오프라인 환경에서도 동작하는 경량화된 모델 아키텍처를 특징으로 합니다. 2026년 2월에도 v0.5.5 업데이트가 이루어지는 등 활발히 유지보수되고 있으며, Silero VAD(음성 활동 감지)와 함께 사용하면 더욱 강력한 음성 처리 파이프라인을 구성할 수 있습니다.

주요 특징

기업 수준 음성-텍스트(STT) 사전 훈련 모델 제공
PyTorch Hub를 통한 단 몇 줄 코드로 간편 사용
영어, 독일어, 스페인어, 러시아어 등 다국어 지원
오프라인 동작 가능한 경량 모델 아키텍처
Silero VAD와 연동한 완전한 음성 처리 파이프라인 구성

Open Source

Silero Models

주요 특징

태그

관련 프로젝트

whisper.cpp

VibeVoice

WhisperX

faster-whisper