Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
ACE-Step 1.5는 소비자용 하드웨어에서 상업급 품질의 음악을 생성할 수 있는 오픈소스 음악 생성 파운데이션 모델입니다. 4B 파라미터 규모의 DiT 디코더를 탑재해 A100 기준 풀 곡 한 곡을 2초 이내에 생성할 수 있으며, 4GB VRAM만으로도 로컬 실행이 가능합니다. 10초~10분 길이의 음악을 생성할 수 있고, 1,000가지 이상의 악기와 스타일을 세밀하게 제어할 수 있습니다. 50개 이상의 언어를 지원하며, 커버 생성, 오디오 편집, 트랙 분리, LoRA 학습, 레퍼런스 오디오 가이던스 기능까지 제공합니다. Mac, AMD, Intel, CUDA 등 다양한 디바이스를 지원합니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함