Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

PagedAttention 기술을 활용한 고처리량, 메모리 효율적 LLM 추론 및 서빙 엔진입니다. NVIDIA, AMD, Intel, TPU 등 멀티플랫폼을 지원하며, GPTQ/AWQ/INT4/INT8/FP8 양자화를 통해 다양한 하드웨어에서 최적화된 성능을 제공합니다. OpenAI 호환 API를 제공하여 기존 애플리케이션과 쉽게 통합할 수 있으며, speculative decoding과 연속 배칭으로 처리 속도를 극대화합니다.
huggingface
SOTA 기계학습 모델을 위한 오픈소스 모델 정의 프레임워크
rasbt
PyTorch로 ChatGPT 스타일 LLM을 처음부터 구현하는 교육용 자료
hiyouga
100개 이상 LLM/VLM 통합 파인튜닝 프레임워크

unslothai
LLM 파인튜닝을 2배 빠르게, 70% 적은 VRAM으로