Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
알리바바 클라우드에서 제안한 공식 비전-언어 모델 저장소입니다. Qwen-VL, Qwen-VL-Chat, Qwen-VL-Plus, Qwen-VL-Max를 포함한 다양한 모델 변형을 제공하며, 이미지, 텍스트, 바운딩 박스를 입력으로 처리하고 텍스트와 공간 주석을 생성할 수 있습니다. 시각적 질문 답변, 문서 분석, 이미지 캡셔닝에 뛰어나며 특히 중국어 이해와 다국어 기능이 강력합니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크