Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Python Audio Separator는 명령줄(CLI) 또는 Python 패키지 형태로 손쉽게 오디오 스템 분리(보컬/반주, 드럼, 베이스 등)를 수행할 수 있는 도구입니다. Ultimate Vocal Remover(UVR) 커뮤니티에서 검증된 다양한 사전학습 모델을 활용하며, MDX-Net, VR Arch, Demucs, MDXC 등 최신 아키텍처를 모두 지원합니다. 단일 명령어로 보컬, 반주, 드럼, 베이스, 피아노, 기타 등 다양한 스템을 분리할 수 있고, CUDA GPU 가속, Apple Silicon(CoreML), CPU 추론을 모두 지원합니다. CPU/GPU용 도커 이미지가 사전 빌드되어 있어 프로덕션 환경에도 즉시 통합할 수 있으며, 카라오케 제작, 리믹스, 음원 복원, AI 학습 데이터 전처리 등에 폭넓게 활용됩니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함