Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
ByteDance Seed 팀이 공개한 7B 활성 파라미터(14B 총 파라미터) 규모의 오픈소스 통합 멀티모달 파운데이션 모델입니다. 대규모 인터리브 멀티모달 데이터로 학습되어 이미지·텍스트 이해, 텍스트→이미지 생성, 그리고 자유 형식의 이미지 편집을 단일 모델로 처리합니다. GenEval 88%를 기록하며 FLUX.1-dev(82%)와 SD3-Medium(74%) 등 특화된 생성 모델을 능가했고, MMBench 85.0·MME 2388로 시각 이해에서도 톱티어 오픈소스 VLM 수준입니다. 단순 편집을 넘어 멀티뷰 합성, 월드 네비게이션 등 '월드 모델링' 작업까지 확장 가능하다는 점이 차별점입니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크