Trending

stable-ts

jianfchMIT2026.06.15

STT2.3K Stars237 Forks5.0천 조회

stable-ts는 OpenAI Whisper의 전사 결과를 더 정확하고 안정적인 타임스탬프로 보정해주는 음성 인식(STT) 보조 라이브러리입니다. 기본 Whisper가 제공하는 부정확한 구간 타임스탬프 문제를 해결하기 위해, 강제 정렬(forced alignment)과 후처리 알고리즘으로 단어·문장 단위의 정밀한 시간 정보를 산출합니다. 무음 구간 감지(VAD)와 비음성 구간 억제를 통해 환각을 줄이고, 자막을 SRT·VTT·ASS 등 다양한 포맷으로 내보낼 수 있습니다. faster-whisper 백엔드도 지원해 속도를 높일 수 있으며, 오디오 인덱싱과 구간 재정렬 기능까지 제공합니다. 정확한 자막 동기화가 필요한 영상 제작, 더빙, 음성 검색 파이프라인에서 특히 유용합니다.

주요 특징

강제 정렬 기반 단어·문장 단위 정밀 타임스탬프 보정
VAD 및 비음성 억제로 환각 감소
SRT·VTT·ASS 등 다양한 자막 포맷 내보내기
faster-whisper 백엔드 지원으로 속도 향상
오디오 인덱싱 및 구간 재정렬 기능

Open Source

stable-ts

주요 특징

태그

관련 프로젝트

whisper.cpp

VibeVoice

WhisperX

faster-whisper