Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
2023년부터 시작된 오디오 생성 AI 모델들의 진화 과정을 시각적으로 추적하는 프로젝트입니다. 음성, 음악, 음향 효과 생성 분야의 주요 모델들의 출시 시간과 성능 발전을 타임라인 형식으로 정리하여, 오디오 AI 생태계의 발전 추이를 한눈에 파악할 수 있습니다. 연구자와 개발자들이 오디오 생성 기술의 발전 방향을 이해하고 최신 트렌드를 따라잡는 데 유용한 레퍼런스입니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함