Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Sapiens는 메타가 공개한 사람 중심(human-centric) 비전 파운데이션 모델 모음으로, 사진 속 인물에 대한 2D 포즈 추정, 신체 부위 분할, 깊이 추정, 표면 법선 예측 등 네 가지 핵심 인체 분석 작업을 하나의 백본에서 처리합니다. 3억 장 규모의 인물 이미지로 사전학습되었으며 최대 1K 고해상도 입력을 지원해, 가려짐이나 다양한 자세·조명·환경에서도 정밀한 결과를 냅니다. 0.3B부터 2B까지 다양한 크기의 모델을 제공해 정확도와 연산 비용을 상황에 맞게 선택할 수 있으며, AR/VR 아바타, 모션 캡처, 가상 피팅, 헬스케어 영상 등 사람을 다루는 응용 전반에 활용할 수 있습니다. 비전 트랜스포머 기반의 단순한 구조로 파인튜닝과 확장이 쉬운 점도 장점입니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크