Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
AirLLM은 단일 4GB GPU만으로 70B 규모의 대형 언어 모델 추론을 가능하게 하는 경량 추론 최적화 라이브러리입니다. 모델 전체를 한꺼번에 GPU에 올리지 않고 레이어 단위로 순차 로딩·실행하는 layer-wise inference 기법을 사용해, 양자화나 증류로 인한 정확도 손실 없이도 메모리 사용량을 획기적으로 낮춥니다. 덕분에 고가의 다중 GPU 서버 없이 일반 소비자용 GPU나 무료 코랩 환경에서도 초대형 모델을 돌려볼 수 있습니다. LLaMA 계열을 비롯한 다양한 오픈 모델과 LoRA/QLoRA 파인튜닝, 압축 가속 옵션을 지원합니다. Apache-2.0 라이선스로 제공되어 상용·연구 모두 자유롭게 사용할 수 있습니다.
huggingface
SOTA 기계학습 모델을 위한 오픈소스 모델 정의 프레임워크
google-gemini
터미널에서 Gemini AI를 사용하는 Google 공식 CLI 에이전트
rasbt
PyTorch로 ChatGPT 스타일 LLM을 처음부터 구현하는 교육용 자료
punkpeye
LLM 도구 연동 표준 MCP 서버 큐레이션 모음