Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
YOLO-World는 AILab-CVC에서 개발한 실시간 오픈 보캐뷸러리 객체 탐지 모델로, CVPR 2024에 채택되었습니다. 기존 YOLO의 빠른 추론 속도를 유지하면서 임의의 텍스트 프롬프트로 객체를 탐지할 수 있어, 별도의 학습 없이도 새로운 카테고리를 인식합니다. CLIP 기반 텍스트 인코딩과 'prompt-then-detect' 패러다임을 활용하여 어휘 임베딩을 모델 파라미터로 재매개변수화함으로써 추가 오버헤드 없이 효율적인 추론이 가능합니다. S/M/L/X 네 가지 스케일의 모델을 제공하며, ONNX 및 TFLite INT8 양자화 배포를 지원합니다. COCO 제로샷에서 최대 46.7 AP를 달성하여 실시간 제로샷 탐지 분야의 선두 모델입니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크