Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
가사와 장르 설명으로 완전한 노래를 생성하는 오픈소스 음악 생성 기초 모델입니다. Suno.ai 수준의 음악성, 충실도, 제어력을 제공하며 영어, 만다린, 광동어, 일본어, 한국어를 지원합니다. LoRA 파인튜닝으로 스타일 전이와 음성 클로닝이 가능하며, 듀얼 트랙 또는 싱글 트랙 음악 생성을 선택할 수 있습니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델
jamiepine
23개 언어 지원, 다중 TTS 엔진 기반의 로컬 음성 합성 스튜디오