Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

NEO는 EvolvingLMMs-Lab에서 개발한 네이티브 비전-랭귀지 모델(Native VLM)입니다. 기존의 모듈식 VLM과 달리, 비전 인코더 없이 픽셀-단어 인코딩, 정렬, 추론을 하나의 밀집 모놀리식 아키텍처 내에서 통합합니다. 390M 이미지-텍스트 쌍만으로 학습하여 더 큰 모듈식 VLM과 경쟁하는 성능을 달성하며, 2B와 9B 파라미터 변형을 제공합니다. 임의의 해상도와 종횡비를 지원하고, MMMU 54.6, MMB 82.1(9B) 등 주요 벤치마크에서 우수한 성능을 보여줍니다. ICLR 2026에 채택되었으며, Apache 2.0 라이선스로 모델 가중치와 학습 코드가 모두 공개되어 있습니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크