Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
NVIDIA TensorRT는 NVIDIA GPU에서 고성능 딥러닝 추론을 위한 SDK입니다. 오픈소스 플러그인과 ONNX 파서를 포함하며 Python pip 설치로 간단하게 배포할 수 있습니다. Linux (x86-64, aarch64), Windows 등 다중 플랫폼을 지원하고 Jetson, DriveOS 등 임베디드 플랫폼 빌드도 제공합니다. 커스터마이즈 가능한 컴파일 옵션, 교차 컴파일, CUDA 최적화 등을 지원하며 안전 중요 애플리케이션을 위한 안전 추론 빌드도 포함합니다. TensorRT 11.0 (Q2 2026)은 약식 네트워크 제거, 명시적 양자화, IPluginV3 API 등 주요 변화를 예정하고 있습니다.

ollama
로컬 LLM을 쉽게 실행하는 도구

ggml-org
C/C++로 작성된 로컬 LLM 추론 엔진

exo-explore
일상 기기를 AI 클러스터로 연결하는 분산 추론 플랫폼
mozilla-ai
단일 파일 하나로 LLM을 설치 없이 즉시 실행하는 배포 도구