Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
AudioCraft는 Meta(Facebook Research)가 개발한 오디오 생성 및 처리를 위한 PyTorch 기반 딥러닝 라이브러리입니다. 최첨단 EnCodec 오디오 압축기/토크나이저와 함께 텍스트 및 멜로디 조건부 음악 생성이 가능한 MusicGen, 범용 오디오 생성 모델 AudioGen을 포함합니다. 텍스트 프롬프트만으로 고품질 음악을 생성할 수 있으며, 멜로디 컨디셔닝을 통해 기존 멜로디를 기반으로 새로운 음악을 만들 수도 있습니다. 연구자와 개발자 모두를 위한 학습 및 추론 코드를 제공하며, Hugging Face와의 통합으로 쉽게 사용할 수 있습니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델