Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Hulu-Med는 저장대학교 AI4H 그룹이 공개한 투명한 제너럴리스트 의료 비전-언어 모델로, 텍스트·2D/3D 비전-언어·비디오 이해를 하나의 아키텍처로 통합합니다. 12개 주요 해부학적 시스템과 14개 의료 영상 모달리티를 포함하는 1670만 개의 공개·합성 데이터셋으로 학습되었으며, 의료 인식 토큰 축소 전략을 통해 3D·비디오 입력에서 최대 55%의 토큰 절감을 달성해 7B-32B 파라미터 모델을 4천-4만 GPU 시간 내에 학습할 수 있습니다. 30개 공개 의료 벤치마크 중 27개에서 오픈소스 모델을 능가하고 16개에서 GPT-4o와 같은 상용 시스템을 뛰어넘으며, 텍스트 추론·VQA·리포트 생성·다국어 진료 대화·희귀 질환 진단까지 폭넓게 지원합니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크