Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Mindee가 개발한 딥러닝 기반 OCR(광학 문자 인식) 라이브러리로, PyTorch 생태계에 공식 통합되었습니다. 텍스트 탐지와 인식을 2단계 파이프라인으로 처리하며, DBNet, LinkNet, FAST 등 다양한 탐지 모델과 CRNN, SAR, MASTER, ViTSTR, PARSeq 등 인식 모델을 선택할 수 있습니다. PDF, 이미지, 웹페이지 등 다양한 입력 형식을 지원하고, 회전된 문서도 처리 가능합니다. Document-Page-Block-Line-Word 계층 구조로 결과를 반환하며, FastAPI 기반 프로덕션 배포 템플릿을 제공합니다. KIE(핵심 정보 추출) 기능으로 특정 필드 자동 추출도 지원합니다.

Comfy-Org
노드 기반 디퓨전 모델 GUI
hacksider
단 한 장의 이미지로 실시간 얼굴 교체 및 딥페이크 구현 - 84K 스타 인기 프로젝트

opendatalab
PDF를 AI 워크플로우용 마크다운/JSON으로 변환하는 비전-언어 기반 문서 파싱 엔진

ultralytics
엣지 최적화 실시간 객체 감지 YOLO 프레임워크