Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

MiniCPM-o는 OpenBMB에서 개발한 Gemini 2.5 Flash급 성능의 경량 멀티모달 대언어모델입니다. 비전, 음성, 실시간 풀듀플렉스 스트리밍을 단일 모델로 통합하며, 스마트폰에서도 실행 가능한 엔드투엔드 아키텍처를 갖추고 있습니다. OpenCompass 벤치마크에서 77.6점으로 GPT-4o와 Gemini 2.0 Pro를 능가하는 성능을 보여주며, 실시간 이중 언어(영어/중국어) 음성 대화와 음성 복제, 180만 픽셀 고해상도 OCR(30개 이상 언어)을 지원합니다. llama.cpp, Ollama, vLLM, SGLang 등 주요 추론 프레임워크를 공식 지원합니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크

moeru-ai
자체 호스팅 AI 음성 동반자 (실시간 채팅, 게임 플레이, 20+ LLM 통합)