Trending

audiomentations

iver56MIT2026.05.25

Audio2.3K Stars219 Forks4.5천 조회

audiomentations는 오디오 머신러닝 모델의 강건성을 높이기 위한 파이썬 데이터 증강 라이브러리입니다. albumentations에서 영감을 받은 깔끔한 API를 통해 노이즈 추가, 시간 축 변형, 피치 변경, 룸 임펄스 응답, 채널 변환 등 수십 종의 변환을 손쉽게 조합할 수 있습니다. CPU에서 빠르게 동작하면서 모노와 멀티채널 오디오 모두를 지원하며, PyTorch·TensorFlow 학습 파이프라인에 자연스럽게 통합됩니다. Kaggle 대회 상위 입상자들이 활용할 정도로 실전 검증된 표준 도구로 자리잡았습니다.

주요 특징

수십 종의 오디오 증강 변환 내장
albumentations 스타일의 직관적 API
모노 및 멀티채널 오디오 지원
PyTorch·TensorFlow 학습 파이프라인 통합
CPU 친화적 고속 처리

Open Source

audiomentations

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)