Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
OpenGVLab의 InternVL-U는 4B 파라미터 규모의 통합 멀티모달 모델(Unified Multimodal Model)로, 멀티모달 이해·추론·이미지 생성·이미지 편집을 하나의 프레임워크에 담은 차세대 오픈소스 모델입니다. 별도의 생성 모델과 이해 모델을 따로 운용할 필요 없이, 단일 모델이 시각 입력 분석부터 새로운 이미지 합성·편집까지 일관되게 처리합니다. InternVL3.5 라인업과 함께 OpenGVLab이 추진 중인 "GPT-4o 수준의 오픈 멀티모달" 방향성을 보여주는 대표 프로젝트로, 4B의 가벼운 크기 덕분에 단일 GPU 환경에서도 실험하기 쉽다는 점이 특징입니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크