Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
EvolvingLMMs-Lab가 개발한 lmms-eval은 텍스트·이미지·비디오·오디오 전 영역의 멀티모달 모델을 하나의 파이프라인으로 평가할 수 있는 "One-for-All" 평가 툴킷입니다. v0.7 릴리스(2026년 2월)에서 8개 도메인에 걸친 25개 이상의 신규 태스크, 새로운 모델 백엔드 2종, 에이전트형 태스크 평가, TorchCodec 기반 비디오 I/O 오버홀(최대 3.58배 빠른 처리) 등 운영성과 파이프라인 성숙도를 크게 끌어올렸습니다. GPT-4o, Claude, Gemini 같은 상용 모델부터 LLaVA·Qwen-VL·InternVL 등 오픈소스 멀티모달 모델까지 동일한 코드 경로로 벤치마크할 수 있어, 연구·산업 양쪽에서 사실상 멀티모달 평가의 표준으로 자리잡았습니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크