Trending

Grounded SAM 2

IDEA-ResearchApache-2.02026.03.29

Vision3.0K Stars352 Forks7.4천 조회

Grounded SAM 2는 IDEA Research에서 개발한 오픈소스 비전 프레임워크로, Grounding DINO, Florence-2, SAM 2를 결합하여 이미지와 비디오에서 텍스트 기반의 객체 탐지, 세그멘테이션, 추적을 수행합니다. 사용자가 자연어로 '빨간 자동차' 또는 '걷고 있는 사람'처럼 설명하면 해당 객체를 자동으로 감지하고 세그멘트합니다. 비디오 스트리밍에서 실시간 ID 추적이 가능하며, Florence-2를 활용한 자동 이미지 라벨링 파이프라인도 제공합니다. 자율주행, 의료 영상, 로보틱스 등 다양한 산업에서 활용되고 있으며, 텍스트-비전 통합의 대표적인 오픈소스 프로젝트입니다.

주요 특징

Grounding DINO + Florence-2 기반 텍스트-객체 매칭
SAM 2 기반 정밀 이미지/비디오 세그멘테이션
실시간 비디오 객체 추적 (ID 연속성 유지)
Florence-2 자동 라벨링 파이프라인
Open-Set 탐지로 사전 학습 없는 새로운 객체 인식

Open Source

Grounded SAM 2

주요 특징

태그

관련 프로젝트

ComfyUI

Deep-Live-Cam

MinerU

Ultralytics YOLO26