Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
알리바바 Qwen 팀이 공개한 20B 파라미터 규모의 MMDiT 기반 이미지 생성·편집 파운데이션 모델입니다. 복잡한 텍스트 렌더링과 정밀한 이미지 편집에서 두각을 나타내며, 특히 중국어를 비롯한 다국어 텍스트를 자연스럽게 이미지에 삽입할 수 있어 인포그래픽·포스터·만화·PPT 제작에 강력한 성능을 보입니다. 인물의 얼굴 디테일과 자연 텍스처 표현이 한층 정교해졌고, Apache-2.0 라이선스로 누구나 자유롭게 활용할 수 있는 오픈소스 비전 파운데이션 모델입니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크