Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Demucs는 Meta(facebookresearch)가 개발한 음악 소스 분리(music source separation) 모델이다. 하나의 완성된 곡에서 보컬, 드럼, 베이스, 그리고 나머지 악기를 각각의 트랙으로 분리해 준다. 최신 버전인 Hybrid Transformer Demucs는 스펙트로그램(주파수 영역)과 파형(시간 영역)을 동시에 처리하는 하이브리드 구조에 트랜스포머를 결합해 분리 품질을 높였다. 명령줄 도구로 손쉽게 사용할 수 있어 음악 제작, 노래방 음원 제작, 리믹스, 음원 분석 등 다양한 작업에 활용된다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
RVC-Project
10분 이하 음성으로 학습하는 retrieval 기반 음성 변환 WebUI