Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Grounding DINO는 IDEA Research에서 개발한 오픈셋 객체 탐지 프레임워크로, 자연어 텍스트 프롬프트만으로 이미지에서 임의의 객체를 탐지할 수 있습니다. DINO 검출 트랜스포머와 Grounded Pre-Training을 결합하여 사전 정의된 카테고리 없이도 텍스트로 설명한 모든 객체를 인식합니다. COCO 데이터셋에서 학습 없이 52.5 AP의 제로샷 성능을 달성했으며, 파인튜닝 시 63.0 AP까지 향상됩니다. Segment Anything, Stable Diffusion 등과 통합하여 세그멘테이션, 이미지 편집 등 다양한 비전 파이프라인의 핵심 모듈로 활용됩니다. ECCV 2024에 공식 채택된 논문의 구현체입니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크