Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
llm-d는 Red Hat, Google Cloud, IBM Research, CoreWeave, NVIDIA가 공동 설립한 Kubernetes 네이티브 분산 LLM 추론 서빙 스택입니다. prefill/decode 분리(disaggregation), 계층형 KV 캐시 오프로딩, prefix-cache 및 load-aware 라우팅을 결합해 대규모 모델을 다양한 가속기에서 효율적으로 서비스합니다. OpenAI 호환 API와 SLO 기반 오토스케일링을 제공해 프로덕션 환경에서 안정적인 LLM 서빙 인프라를 구축할 수 있도록 설계되었습니다.
huggingface
SOTA 기계학습 모델을 위한 오픈소스 모델 정의 프레임워크
google-gemini
터미널에서 Gemini AI를 사용하는 Google 공식 CLI 에이전트
rasbt
PyTorch로 ChatGPT 스타일 LLM을 처음부터 구현하는 교육용 자료
punkpeye
LLM 도구 연동 표준 MCP 서버 큐레이션 모음