Trending

DINOv2

facebookresearchApache-2.02026.03.24

Vision12.6K Stars1.2K Forks7.6천 조회

Meta AI Research가 개발한 자기지도 학습(Self-Supervised Learning) 비전 트랜스포머 모델입니다. 1억 4,200만 장의 라벨 없는 이미지로 사전 학습되어, 이미지 분류, 깊이 추정, 시맨틱 세그멘테이션 등 다양한 컴퓨터 비전 태스크에서 단순 선형 분류기만으로도 뛰어난 성능을 발휘합니다. ViT-S/B/L/g 4가지 모델 크기를 제공하며, 최근 의료 영상(XRay-DINO)과 현미경 이미지(Cell-DINO) 특화 모델까지 확장되었습니다. ImageNet 선형 평가에서 87.1% 정확도를 달성합니다.

주요 특징

1억 4,200만 장 비라벨 이미지로 자기지도 사전 학습
ViT-S/B/L/g 4가지 모델 크기 및 레지스터 토큰 지원
이미지 분류, 깊이 추정, 시맨틱 세그멘테이션 태스크 헤드 제공
의료 영상(XRay-DINO) 및 현미경(Cell-DINO) 특화 모델 확장
PyTorch Hub 통합으로 간편한 모델 로딩 및 추론

Open Source

DINOv2

주요 특징

태그

관련 프로젝트

ComfyUI

Deep-Live-Cam

MinerU

Ultralytics YOLO26