Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
liteparse는 LlamaIndex를 만드는 run-llama 팀이 오픈소스로 공개한 빠르고 가벼운 문서 파서입니다. PDF, 이미지, 스캔본 등 다양한 문서 포맷에서 텍스트, 표, 레이아웃 정보를 정확하게 추출해 LLM 파이프라인에 바로 투입할 수 있는 구조화된 출력으로 변환합니다. RAG 시스템에서 가장 큰 병목으로 꼽히는 '문서 전처리 품질'을 해결하기 위해 설계되었으며, 클라우드 OCR 서비스 대비 저비용으로 대량 문서를 처리할 수 있다는 점이 강점입니다. Apache-2.0 라이선스로 상업적 사용도 자유로워 자체 RAG 인프라를 구축하려는 팀에 적합합니다.
n8n-io
AI 네이티브 워크플로우 자동화 플랫폼 (181K stars)

Shubhamsaboo
LLM 앱 예제 및 튜토리얼 컬렉션

microsoft
다양한 파일을 마크다운으로 변환하는 Microsoft 도구

mendableai
웹을 LLM-ready 데이터로 변환하는 AI용 웹 API