Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
MOSS-Audio는 OpenMOSS 팀이 공개한 통합 오디오 이해 파운데이션 모델입니다. 음성, 환경음, 음악 등 실세계의 복잡한 오디오를 하나의 모델로 처리할 수 있으며, 음성 이해, 환경음 식별, 음악 분석, 오디오 캡셔닝, 시간 인식 QA, 복합 추론까지 폭넓은 작업을 지원합니다. 2026년 4월 공개 이후 단기간에 GitHub 트렌딩에 오를 만큼 주목받고 있으며, 멀티모달 오디오 AI 연구의 새로운 기준을 제시하는 오픈소스 프로젝트입니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함