Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
FunMusic(InspireMusic)은 Alibaba의 FunAudioLLM 팀이 공개한 음악·노래·오디오 생성 통합 툴킷입니다. 오토리그레시브 트랜스포머와 플로우 매칭(flow-matching) 기반 모델을 결합한 구조로, Qwen2.5를 백본으로 사용해 텍스트 프롬프트로부터 음악을 생성하거나 기존 음악을 이어서 생성(continuation)하는 작업을 지원합니다. 고비트레이트 오디오 토크나이저로 파형을 이산 토큰으로 변환한 뒤, 초해상도 플로우 매칭 모델과 보코더로 고품질 장편 음악을 만들어냅니다. 텍스트-투-뮤직, 음악 재구성, 초해상도 등을 제공하며 추론·학습·배포를 아우르는 Apache-2.0 라이선스 오픈소스로, 음악 생성 연구자와 개발자를 대상으로 합니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
RVC-Project
10분 음성으로 학습하는 검색 기반 음성 변환 웹 UI