Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
2023년부터 시작된 오디오 생성 AI 모델들의 진화 과정을 시각적으로 추적하는 프로젝트입니다. 음성, 음악, 음향 효과 생성 분야의 주요 모델들의 출시 시간과 성능 발전을 타임라인 형식으로 정리하여, 오디오 AI 생태계의 발전 추이를 한눈에 파악할 수 있습니다. 연구자와 개발자들이 오디오 생성 기술의 발전 방향을 이해하고 최신 트렌드를 따라잡는 데 유용한 레퍼런스입니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델
jamiepine
23개 언어 지원, 다중 TTS 엔진 기반의 로컬 음성 합성 스튜디오