Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
모든 종류의 멀티모달 모델을 인간의 의도와 가치에 맞추기 위한 고도로 모듈화된 프레임워크입니다. 텍스트, 이미지, 오디오, 비디오 조합을 포함한 다양한 모달리티에 걸쳐 여러 세부 조정 방법(SFT, DPO, PPO, RM)을 지원하며, 구현형 AI 애플리케이션을 위한 비전-언어-행동 모델도 지원합니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크