Trending

TorchAudio

pytorchBSD-2-Clause2026.03.14

Audio2.8K Stars764 Forks8.2천 조회

PyTorch 기반 오디오 신호 처리 및 변환을 위한 머신러닝 라이브러리입니다. 스펙트로그램, MelSpectrogram, MFCC, 음성 리샘플링 등 핵심 오디오 변환 기능을 제공하며, Kaldi 호환 구현으로 음성 처리의 표준을 따릅니다. 강제 정렬(forced alignment), 공통 오디오 데이터셋 지원으로 음성 인식 및 오디오 ML 프로젝트를 빠르게 개발할 수 있습니다. PyTorch 생태계와 완벽 통합되어 있습니다.

주요 특징

스펙트로그램 및 MelSpectrogram 계산
MFCC 생성
오디오 리샘플링
강제 정렬(Forced Alignment)
Kaldi 호환 구현
오디오 데이터셋 로더

Open Source

TorchAudio

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)