Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
GAIR-NLP에서 개발한 최초의 오픈소스 자동회귀형 및 기본 멀티모달 모델로, 확산 없이 인터리브된 이미지-텍스트 생성을 지원합니다. Anole-7B-v0.1은 소량의 이미지 데이터(5,859개 이미지, 약 600만 이미지 토큰)와 적은 파라미터(4천만 미만)로 개발되었으며, 8개 A100 GPU에서 약 30분 내에 미세 조정되었습니다. Meta AI의 Chameleon을 기반으로 혁신적인 미세 조정 전략을 채택하여 데이터 효율성과 파라미터 효율성을 모두 달성했습니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크