Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Open-Unmix는 PyTorch 기반 음악 소스 분리 프레임워크입니다. 혼합된 음악 트랙에서 보컬, 드럼, 베이스, 기타 악기를 개별 트랙으로 분리하는 기능을 제공합니다. MUSDB18 벤치마크 데이터셋에서 학습된 사전훈련 모델을 제공하며, 사용자가 자신만의 데이터로 커스텀 분리 모델을 학습할 수도 있습니다. 음악 프로덕션에서 리믹스 작업, 노래방 트랙 생성, 음악 교육 등에 활용되며, MIT 라이선스로 상업적 사용이 가능합니다. 간단한 API로 빠르게 통합할 수 있어 오디오 처리 파이프라인 구축에 적합합니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델
jamiepine
23개 언어 지원, 다중 TTS 엔진 기반의 로컬 음성 합성 스튜디오