Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Meta AI Research가 개발한 자기지도 학습(Self-Supervised Learning) 비전 트랜스포머 모델입니다. 1억 4,200만 장의 라벨 없는 이미지로 사전 학습되어, 이미지 분류, 깊이 추정, 시맨틱 세그멘테이션 등 다양한 컴퓨터 비전 태스크에서 단순 선형 분류기만으로도 뛰어난 성능을 발휘합니다. ViT-S/B/L/g 4가지 모델 크기를 제공하며, 최근 의료 영상(XRay-DINO)과 현미경 이미지(Cell-DINO) 특화 모델까지 확장되었습니다. ImageNet 선형 평가에서 87.1% 정확도를 달성합니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크