Trending

WeNet

wenet-e2eApache-2.02026.06.15

STT5.1K Stars1.2K Forks5.0천 조회

WeNet은 프로덕션 환경을 최우선으로 설계된 엔드투엔드(E2E) 음성 인식(STT) 툴킷입니다. 연구와 실제 서비스 배포 사이의 간극을 메우는 것을 목표로, 모델 학습부터 추론, 서빙까지 하나의 통합된 파이프라인으로 제공합니다. Conformer·Transformer 기반의 최신 음성 인식 아키텍처를 지원하며, U2/U2++ 구조를 통해 스트리밍과 비스트리밍 인식을 동시에 처리할 수 있습니다. LibTorch 기반의 런타임으로 x86 서버, ARM 임베디드, 안드로이드, iOS 등 다양한 플랫폼에 배포 가능하며, 언어 모델 융합과 양자화도 지원합니다. 중국어·영어 등 다국어 환경에서 폭넓게 검증되어 실서비스 음성 인식 구축에 널리 활용됩니다.

주요 특징

Conformer/Transformer 기반 엔드투엔드 음성 인식
U2/U2++ 구조로 스트리밍·비스트리밍 통합 처리
LibTorch 런타임으로 서버·임베디드·모바일 배포
언어 모델 융합 및 양자화 지원
학습부터 서빙까지 통합 프로덕션 파이프라인

Open Source

WeNet

주요 특징

태그

관련 프로젝트

whisper.cpp

VibeVoice

WhisperX

faster-whisper