Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

Firecrawl은 웹사이트를 LLM이 바로 사용할 수 있는 마크다운, HTML, 구조화된 JSON 데이터로 변환하는 AI용 웹 데이터 API입니다. 단일 URL 스크래핑부터 전체 사이트 크롤링, 웹 검색 결과 추출, AI 에이전트 기반 자동 데이터 수집까지 지원합니다. 프록시, JavaScript 렌더링, 동적 콘텐츠 등 복잡한 상황을 자동 처리하며, PDF/DOCX/이미지 파싱도 가능합니다. 벤치마크 평가에서 80% 이상의 업계 최고 수준 안정성을 보여주며, RAG 파이프라인과 AI 에이전트의 핵심 데이터 레이어로 활용됩니다.
n8n-io
AI 네이티브 워크플로우 자동화 플랫폼 (181K stars)

Shubhamsaboo
LLM 앱 예제 및 튜토리얼 컬렉션

microsoft
다양한 파일을 마크다운으로 변환하는 Microsoft 도구

PaddlePaddle
111개 언어 OCR AI 도구