Trending

MOSS-Audio

OpenMOSSApache-2.02026.05.25

Audio471 Stars35 Forks5.0천 조회

MOSS-Audio는 OpenMOSS 팀이 공개한 통합 오디오 이해 파운데이션 모델입니다. 음성, 환경음, 음악 등 실세계의 복잡한 오디오를 하나의 모델로 처리할 수 있으며, 음성 이해, 환경음 식별, 음악 분석, 오디오 캡셔닝, 시간 인식 QA, 복합 추론까지 폭넓은 작업을 지원합니다. 2026년 4월 공개 이후 단기간에 GitHub 트렌딩에 오를 만큼 주목받고 있으며, 멀티모달 오디오 AI 연구의 새로운 기준을 제시하는 오픈소스 프로젝트입니다.

주요 특징

음성·사운드·음악을 아우르는 통합 오디오 이해 모델
오디오 캡셔닝과 자연어 질의응답 지원
시간 인식(time-aware) 기반 정밀 분석
환경음 식별 및 복합 오디오 추론
실세계 시나리오를 위한 오픈소스 파운데이션 모델

Open Source

MOSS-Audio

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)