Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Grounded SAM 2는 IDEA Research에서 개발한 오픈소스 비전 프레임워크로, Grounding DINO, Florence-2, SAM 2를 결합하여 이미지와 비디오에서 텍스트 기반의 객체 탐지, 세그멘테이션, 추적을 수행합니다. 사용자가 자연어로 '빨간 자동차' 또는 '걷고 있는 사람'처럼 설명하면 해당 객체를 자동으로 감지하고 세그멘트합니다. 비디오 스트리밍에서 실시간 ID 추적이 가능하며, Florence-2를 활용한 자동 이미지 라벨링 파이프라인도 제공합니다. 자율주행, 의료 영상, 로보틱스 등 다양한 산업에서 활용되고 있으며, 텍스트-비전 통합의 대표적인 오픈소스 프로젝트입니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크