Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
TRL은 Hugging Face가 개발한 파운데이션 모델 사후 학습 전문 라이브러리입니다. SFT(지도 파인튜닝), GRPO(그룹 상대 정책 최적화), DPO(직접 선호도 최적화) 등 최신 학습 기법을 통합 제공합니다. 2026년 3월 31일 v1.0.0 메이저 릴리즈를 달성하며 단순 실험 도구에서 프로덕션급 사후 학습 플랫폼으로 전환했습니다. 보상 모델 학습, RLHF 파이프라인, 선호도 정렬까지 LLM 사후 학습의 전 과정을 커버합니다.
huggingface
SOTA 기계학습 모델을 위한 오픈소스 모델 정의 프레임워크
rasbt
PyTorch로 ChatGPT 스타일 LLM을 처음부터 구현하는 교육용 자료

vllm-project
고성능 LLM 추론 및 서빙 엔진
hiyouga
100개 이상 LLM/VLM 통합 파인튜닝 프레임워크