Trending

Hulu-Med

ZJUI-AI4HApache-2.02026.06.08

멀티모달736 Stars31 Forks4.8천 조회

Hulu-Med는 저장대학교 AI4H 그룹이 공개한 투명한 제너럴리스트 의료 비전-언어 모델로, 텍스트·2D/3D 비전-언어·비디오 이해를 하나의 아키텍처로 통합합니다. 12개 주요 해부학적 시스템과 14개 의료 영상 모달리티를 포함하는 1670만 개의 공개·합성 데이터셋으로 학습되었으며, 의료 인식 토큰 축소 전략을 통해 3D·비디오 입력에서 최대 55%의 토큰 절감을 달성해 7B-32B 파라미터 모델을 4천-4만 GPU 시간 내에 학습할 수 있습니다. 30개 공개 의료 벤치마크 중 27개에서 오픈소스 모델을 능가하고 16개에서 GPT-4o와 같은 상용 시스템을 뛰어넘으며, 텍스트 추론·VQA·리포트 생성·다국어 진료 대화·희귀 질환 진단까지 폭넓게 지원합니다.

주요 특징

텍스트·2D/3D 비전-언어·비디오를 단일 아키텍처로 통합한 의료 제너럴리스트 VLM
12개 해부학 시스템과 14개 의료 영상 모달리티의 1670만 샘플로 학습
의료 인식 토큰 축소 전략으로 3D·비디오 입력 최대 55% 토큰 절감
30개 의료 벤치마크 중 27개에서 오픈소스 SOTA, 16개에서 GPT-4o 능가
VQA·리포트 생성·다국어 진료 대화·희귀 질환 진단까지 폭넓은 임상 태스크 지원

Open Source

Hulu-Med

주요 특징

태그

관련 프로젝트

MiniCPM-V

LLaVA

MiniCPM-o

UniLM