Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
NVIDIA Labs가 공개한 효율적인 고해상도 이미지 합성 프레임워크입니다. Linear Diffusion Transformer(Linear DiT) 구조를 도입해 기존 디퓨전 트랜스포머 대비 메모리 사용량과 추론 시간을 획기적으로 줄이면서도, 4K급 고해상도 이미지를 빠르게 생성할 수 있는 것이 특징입니다. NVFP4 같은 저정밀 추론과 강화학습 기반 정렬을 결합해 단일 GPU에서 고품질 텍스트-이미지 생성과 텍스트-비디오 생성까지 다룰 수 있는 통합 디퓨전 시스템으로, 연구·산업 양쪽에서 디퓨전 모델 효율성의 새로운 기준을 제시합니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크