Trending

Riffusion

riffusionMIT2026.05.25

Audio3.9K Stars480 Forks4.9천 조회

Riffusion은 Stable Diffusion 기반의 이미지 생성 모델을 활용해 실시간으로 음악을 생성하는 오픈소스 프로젝트입니다. 텍스트 프롬프트를 스펙트로그램 이미지로 변환한 뒤 오디오로 디코딩하는 독창적인 접근으로 화제를 모았으며, 이후 hobby 저장소 형태로 코어 라이브러리와 실시간 추론 코드가 공개되어 연구자와 개발자들이 자신의 환경에서 직접 실행하고 확장할 수 있습니다. 텍스트→음악 생성, 무한 잼 세션, 스타일 보간 등 다양한 창작 응용이 가능합니다.

주요 특징

Stable Diffusion 기반 음악 생성 파이프라인
텍스트 프롬프트 → 스펙트로그램 → 오디오 변환
실시간 스트리밍 음악 생성 지원
스타일 보간과 무한 잼 세션 가능
로컬 GPU에서 자체 호스팅 가능

Open Source

Riffusion

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)