Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

MarkItDown은 Microsoft가 개발한 경량 Python 유틸리티로, 다양한 파일 형식을 마크다운으로 변환합니다. PDF, PowerPoint, Word, Excel, HTML, CSV, JSON, XML, EPUB 등 20가지 이상의 포맷을 지원하며, OCR을 통한 이미지 텍스트 추출과 오디오 음성 전사, YouTube URL 처리까지 가능합니다. LLM과 텍스트 분석 파이프라인에 최적화되어 문서 구조를 보존하면서 변환하며, Azure Document Intelligence와의 클라우드 통합도 지원합니다. 플러그인 아키텍처를 통해 기능 확장이 용이하고, 74명의 컨트리뷰터가 참여하는 활발한 오픈소스 커뮤니티를 보유하고 있습니다.
n8n-io
AI 네이티브 워크플로우 자동화 플랫폼 (181K stars)

Shubhamsaboo
LLM 앱 예제 및 튜토리얼 컬렉션

mendableai
웹을 LLM-ready 데이터로 변환하는 AI용 웹 API

PaddlePaddle
111개 언어 OCR AI 도구