Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

PagedAttention 기술을 활용한 고처리량, 메모리 효율적 LLM 추론 및 서빙 엔진입니다. NVIDIA, AMD, Intel, TPU 등 멀티플랫폼을 지원하며, GPTQ/AWQ/INT4/INT8/FP8 양자화를 통해 다양한 하드웨어에서 최적화된 성능을 제공합니다. OpenAI 호환 API를 제공하여 기존 애플리케이션과 쉽게 통합할 수 있으며, speculative decoding과 연속 배칭으로 처리 속도를 극대화합니다.
huggingface
SOTA 기계학습 모델을 위한 오픈소스 모델 정의 프레임워크
google-gemini
터미널에서 Gemini AI를 사용하는 Google 공식 CLI 에이전트
rasbt
PyTorch로 ChatGPT 스타일 LLM을 처음부터 구현하는 교육용 자료
punkpeye
LLM 도구 연동 표준 MCP 서버 큐레이션 모음