Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Moonshot AI가 공개한 Mixture-of-Experts(MoE) 구조의 비전-언어 모델입니다. 약 30억 개 수준의 활성 파라미터만 사용해 효율을 유지하면서도 멀티모달 추론, 긴 문맥 이해, 화면 조작·도구 사용 같은 에이전트 작업을 지원합니다. 다중 이미지와 긴 문서를 한 번에 처리할 수 있는 장문맥 능력이 특징이며, 사고 과정을 단계적으로 보여주는 Thinking 버전도 별도로 제공해 추론형 작업에 활용할 수 있습니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크