Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
실제 멀티모달 이해를 위해 설계된 오픈소스 비전-언어 모델입니다. 논리 다이어그램, 웹 페이지, 수식 인식, 과학 문헌, 자연 이미지, 복잡한 시나리오의 구현형 지능 등을 처리할 수 있습니다. 1.3B와 7B 파라미터 모델을 모두 기본 및 채팅 변형으로 제공하며 상용 애플리케이션을 지원합니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크