Trending

WhisperLive

collaboraMIT2026.03.10

STT3.9K Stars536 Forks8.0천 조회

WhisperLive는 Collabora에서 개발한 실시간 음성 인식 애플리케이션으로, OpenAI의 Whisper 모델을 기반으로 거의 실시간에 가까운 음성-텍스트 변환을 제공합니다. 마이크를 통한 라이브 오디오 입력과 사전 녹음된 오디오 파일 모두를 지원하며, faster-whisper, TensorRT, OpenVINO 등 3가지 백엔드를 선택할 수 있어 다양한 하드웨어 환경에 최적화된 추론이 가능합니다. Chrome과 Firefox 브라우저 확장 프로그램을 통해 웹 브라우저에서 직접 오디오를 트랜스크립션할 수 있으며, iOS 네이티브 클라이언트도 지원합니다. WebSocket 기반 서버-클라이언트 아키텍처로 설계되어 확장성이 뛰어나고, Intel CPU/iGPU/dGPU에서도 OpenVINO를 통해 효율적인 추론이 가능합니다.

주요 특징

실시간 마이크 입력 및 오디오 파일 트랜스크립션 지원
faster-whisper, TensorRT, OpenVINO 3가지 추론 백엔드
Chrome/Firefox 브라우저 확장 프로그램으로 웹 오디오 변환
WebSocket 기반 서버-클라이언트 아키텍처로 확장성 확보
iOS 네이티브 클라이언트 및 Intel CPU/GPU 최적화 지원

Open Source

WhisperLive

주요 특징

태그

관련 프로젝트

whisper.cpp

VibeVoice

WhisperX

faster-whisper