Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
NUS NExT 연구팀에서 개발한 Any-to-Any 멀티모달 대규모 언어 모델입니다. 텍스트, 이미지, 비디오, 오디오 등 모든 조합의 입출력을 자유롭게 처리할 수 있는 것이 핵심 특징입니다. 기존 멀티모달 모델들이 특정 입출력 조합만 지원하는 것과 달리, NExT-GPT는 모달리티 전환 인코더와 디코더를 통해 진정한 범용 멀티모달 상호작용을 구현합니다. 경량 학습 방식으로 효율적인 파인튜닝이 가능합니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크