Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
audiomentations는 오디오 머신러닝 모델의 강건성을 높이기 위한 파이썬 데이터 증강 라이브러리입니다. albumentations에서 영감을 받은 깔끔한 API를 통해 노이즈 추가, 시간 축 변형, 피치 변경, 룸 임펄스 응답, 채널 변환 등 수십 종의 변환을 손쉽게 조합할 수 있습니다. CPU에서 빠르게 동작하면서 모노와 멀티채널 오디오 모두를 지원하며, PyTorch·TensorFlow 학습 파이프라인에 자연스럽게 통합됩니다. Kaggle 대회 상위 입상자들이 활용할 정도로 실전 검증된 표준 도구로 자리잡았습니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함