Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
NVIDIA-NeMo/Nemotron은 NVIDIA의 오픈 모델 패밀리 Nemotron을 위한 공식 개발자 자산 허브입니다. 최신 Nemotron 3 Nano Omni(30B-A3B 하이브리드 Mamba-Transformer MoE)를 비롯해 텍스트·이미지·비디오·오디오를 네이티브로 처리하는 옴니모달 모델의 학습 레시피, 사용 쿡북, 데이터셋, 엔드투엔드 레퍼런스 예제를 한곳에 모았습니다. 문서 인텔리전스(MMLongBench-Doc, OCRBenchV2), 비디오·오디오 벤치마크에서 동급 오픈 모델 최고 수준의 정확도를 기록하면서도, 대안 대비 최대 9배 처리량과 2.9배 단일 스트림 추론 속도를 제공해 에이전트형 멀티모달 워크로드에 최적화되어 있습니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크