Trending

Speaches

speaches-aiMIT2026.03.07

STT3.0K Stars374 Forks8.2천 조회

Speaches는 OpenAI API와 완벽 호환되는 오픈소스 음성 처리 서버입니다. faster-whisper 기반의 음성-텍스트 변환(STT), piper와 Kokoro를 활용한 텍스트-음성 변환(TTS), 그리고 실시간 음성 상호작용을 위한 Realtime API를 제공합니다. 동적 모델 로딩으로 요청 시 자동으로 모델을 불러오고, 비활성 시 언로드하여 메모리를 효율적으로 관리합니다. SSE 기반 스트리밍을 지원하여 전사 완료를 기다릴 필요 없이 실시간으로 결과를 받을 수 있으며, GPU와 CPU 모두 지원합니다. OpenAI SDK와 호환되므로 기존 OpenAI API 기반 프로젝트에서 드롭인 대체가 가능합니다.

주요 특징

OpenAI API 완벽 호환 - 기존 SDK/도구 그대로 사용 가능
동적 모델 로딩 - 요청 시 자동 로드, 비활성 시 언로드
SSE 스트리밍 전사 - 실시간으로 전사 결과 수신
Realtime API 지원 - 실시간 음성 상호작용 가능
GPU/CPU 양쪽 지원 - 다양한 하드웨어 환경에서 운영

Open Source

Speaches

주요 특징

태그

관련 프로젝트

whisper.cpp

VibeVoice

WhisperX

faster-whisper