Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
VGGT(Visual Geometry Grounded Transformer)는 Meta AI Research가 개발한 3D 장면 이해 모델로 CVPR 2025 최우수 논문상을 수상한 비전 AI 혁신작입니다. 단일 또는 다수의 이미지 뷰에서 카메라 파라미터, 포인트 맵, 깊이 맵, 3D 포인트 트랙 등 장면의 핵심 3D 속성을 수 초 내에 직접 추론합니다. 카메라 파라미터 추정, 다시점 깊이 추정, 밀집 포인트 클라우드 재구성, 포인트 트래킹 등 다양한 3D 태스크에서 최첨단 결과를 달성하며, 피드포워드 방식으로 별도 최적화 없이 빠른 3D 재구성이 가능합니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크