Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

llama.cpp는 C/C++로 작성된 고성능 LLM 추론 엔진입니다. Georgi Gerganov가 개발한 이 프로젝트는 GGML 텐서 라이브러리를 기반으로 하며, 다양한 LLM 모델을 로컬에서 효율적으로 실행할 수 있게 해줍니다. 특히 양자화(Quantization) 기술을 통해 모델 크기를 크게 줄이면서도 품질을 유지하여 일반 소비자급 하드웨어에서도 대규모 언어 모델을 실행할 수 있습니다. CPU, GPU(CUDA, Metal, Vulkan) 등 다양한 하드웨어 백엔드를 지원하며, 메모리 효율성이 뛰어납니다.