Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

InternLM-XComposer는 상하이 AI 연구소에서 개발한 종합 멀티모달 시스템으로, 최신 버전 2.5-OmniLive는 장시간 스트리밍 비디오 및 오디오 상호작용을 지원합니다. 7B LLM 백엔드로 GPT-4V 수준의 성능을 달성하며, 초고해상도 이미지 이해, 세밀한 비디오 분석, 다중 이미지 대화, 웹페이지 생성까지 가능합니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크