Trending

AudioGPT

AIGC-AudioMIT2026.03.14

Audio10.2K Stars864 Forks7.8천 조회

음성, 음악, 사운드, 토킹 헤드를 이해하고 생성하는 종합 오디오 AI 시스템입니다. 텍스트-음성 변환, 음성 스타일 전이, 음성 인식, 음악 생성, 오디오 합성, 얼굴 애니메이션 등 다양한 멀티모달 오디오 작업을 단일 인터페이스에서 수행할 수 있습니다. FastSpeech, VITS, Whisper, DiffSinger, Make-An-Audio 등 최신 AI 모델을 통합하여 복잡한 오디오 처리 작업을 자동화합니다.

주요 특징

음성 합성 및 스타일 전이
음악 생성 및 싱잉 합성
오디오 생성 및 인페인팅
음성 인식 및 번역
토킹 헤드 애니메이션 합성
음성 향상 및 분리

Open Source

AudioGPT

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)