Trending

NExT-GPT

NExT-GPTBSD-3-Clause2026.03.27

멀티모달3.8K Stars310 Forks7.5천 조회

NUS NExT 연구팀에서 개발한 Any-to-Any 멀티모달 대규모 언어 모델입니다. 텍스트, 이미지, 비디오, 오디오 등 모든 조합의 입출력을 자유롭게 처리할 수 있는 것이 핵심 특징입니다. 기존 멀티모달 모델들이 특정 입출력 조합만 지원하는 것과 달리, NExT-GPT는 모달리티 전환 인코더와 디코더를 통해 진정한 범용 멀티모달 상호작용을 구현합니다. 경량 학습 방식으로 효율적인 파인튜닝이 가능합니다.

주요 특징

Any-to-Any 멀티모달 입출력
텍스트/이미지/비디오/오디오 통합
모달리티 전환 인코더-디코더
경량 파인튜닝 지원
범용 멀티모달 대화 시스템

Open Source

NExT-GPT

주요 특징

태그

관련 프로젝트

LLaVA

MiniCPM-o

UniLM

Jina Serve