Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Skywork AI가 공개한 비전-언어 추론 특화 멀티모달 모델 시리즈입니다. DeepSeek-R1 계열의 추론 방식과 GRPO 기반 강화학습을 이미지와 텍스트가 결합된 입력에 적용해, 차트·수식·과학 도표 같은 시각 자료가 포함된 복잡한 문제를 단계적으로 풀어냅니다. 모델 가중치와 학습 코드를 함께 공개해 로컬 실행과 파인튜닝이 가능하며, R1V2·R1V3 등 후속 버전을 통해 추론 정확도와 효율을 꾸준히 개선해 왔습니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크