Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

Moondream은 경량화에 초점을 맞춘 오픈소스 비전 언어 모델(VLM)입니다. 단 1GB의 작은 용량으로 노트북부터 엣지 디바이스까지 어디서든 실행 가능합니다. 2B 파라미터 범용 모델과 0.5B 파라미터 엣지 특화 모델을 제공하며, 이미지 캡셔닝, 시각 질의응답, 객체 감지 등 다양한 비전 작업을 수행합니다. 최신 Moondream 3 Preview는 MoE(전문가 혼합) 아키텍처와 32K 컨텍스트 윈도우를 갖추어 포인팅, 카운팅, 객체 감지 등 네이티브 비전 스킬을 지원합니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크