Trending

ACE-Step 1.5

ace-stepMIT2026.05.06

Audio10.0K Stars1.2K Forks4.8천 조회

ACE-Step 1.5는 소비자용 하드웨어에서 상업급 품질의 음악을 생성할 수 있는 오픈소스 음악 생성 파운데이션 모델입니다. 4B 파라미터 규모의 DiT 디코더를 탑재해 A100 기준 풀 곡 한 곡을 2초 이내에 생성할 수 있으며, 4GB VRAM만으로도 로컬 실행이 가능합니다. 10초~10분 길이의 음악을 생성할 수 있고, 1,000가지 이상의 악기와 스타일을 세밀하게 제어할 수 있습니다. 50개 이상의 언어를 지원하며, 커버 생성, 오디오 편집, 트랙 분리, LoRA 학습, 레퍼런스 오디오 가이던스 기능까지 제공합니다. Mac, AMD, Intel, CUDA 등 다양한 디바이스를 지원합니다.

주요 특징

A100 기준 풀 곡 한 곡을 2초 이내 초고속 생성
4GB VRAM으로 로컬 실행 가능, Mac/AMD/Intel/CUDA 전 플랫폼 지원
1,000가지 이상 악기와 스타일 세밀 제어 + 50개 이상 언어 지원
커버 생성, 오디오 편집, 트랙 분리, LoRA 개인화 스타일 학습
Gradio UI와 REST API 인터페이스 제공

Open Source

ACE-Step 1.5

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI