Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
ByteDance Music Source Separation은 바이트댄스에서 공개한 음악 소스 분리 프로젝트입니다. 혼합 오디오에서 보컬, 반주, 개별 악기 등을 고품질로 분리하는 딥러닝 모델을 제공합니다. ResUNet 기반 아키텍처로 높은 분리 품질을 달성하며, 음성 향상과 악기 분리 등 다양한 분리 시스템에 재사용할 수 있도록 설계되었습니다. TikTok과 같은 대규모 플랫폼의 오디오 처리 기술력을 기반으로 하며, 음악 리믹스, 노래방, 오디오 편집 등 실용적인 활용 사례가 풍부합니다. 1,300개 이상의 GitHub 스타를 보유하고 있습니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델
jamiepine
23개 언어 지원, 다중 TTS 엔진 기반의 로컬 음성 합성 스튜디오