Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

ZAI에서 개발한 멀티모달 문서 이해 모델입니다. 0.9B 파라미터의 경량 구조로 OmniDocBench V1.5 벤치마크에서 1위를 달성했습니다. 복잡한 테이블, 코드 문서, 도장, 실제 레이아웃 등을 정확하게 처리하며, Zhipu Cloud API, vLLM/SGLang 자체 호스팅, Ollama 엣지 배포 등 3가지 방식으로 배포할 수 있습니다. CogViT + GLM 아키텍처로 시각과 언어를 동시에 이해하는 것이 특징입니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크