Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
NEO는 픽셀-단어 인코딩, 정렬, 추론을 단일 모놀리식 아키텍처로 통합하는 네이티브 비전-언어 모델입니다. 기존 모듈식 VLM 설계에서 벗어나 390M 이미지-텍스트 예제만으로 경쟁력 있는 성능을 달성합니다. ICLR 2026에 발표되었으며, 2B와 9B 파라미터 모델을 제공하고 자유로운 해상도의 이미지 입력을 지원합니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크