Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
SmolVLM은 Hugging Face에서 개발한 경량의 비전-언어 모델 패밀리로, 온디바이스 환경에서 효율적으로 실행되는 강력한 모델을 제공합니다. 완전히 공개된 가중치와 상세한 학습 정보를 함께 제공하며, 이미지와 텍스트를 동시에 처리하여 시각 QA, 이미지 설명 등 다양한 작업을 수행할 수 있습니다. 11조 토큰으로 학습한 기초 모델을 바탕으로 하며, 영어, 프랑스어, 스페인어 등 6개 언어를 지원합니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크