Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

OpenDriveVLA는 대규모 비전-랭귀지-액션(VLA) 모델을 활용한 엔드투엔드 자율주행 시스템입니다. AAAI 2026에 채택된 이 프로젝트는 시각 입력을 처리하고 주행 결정을 직접 생성하는 통합 모델로, 기존의 모듈식 자율주행 파이프라인을 대체합니다. LLaVA-NeXT와 Qwen2.5 기반 모델을 활용하며, mmcv/mmdet3d 라이브러리를 커스텀 최적화했습니다. 0.5B 체크포인트가 HuggingFace에 공개되어 있으며, DeepSpeed와 Transformers 프레임워크를 통합하여 효율적인 학습과 추론을 지원합니다. 자율주행 AI의 엔드투엔드 접근법을 실현한 오픈소스 연구 프로젝트입니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크