Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Sea AI Lab(sail-sg)이 개발한 연구 친화적 LLM 온라인 정렬(online alignment) 프레임워크입니다. 강화학습(RLHF), 선호 학습(DPO), 온라인 RL 등 다양한 LLM 정렬 기법을 단일 프레임워크에서 실험할 수 있도록 설계되었습니다. 듀얼링 밴딧·톰슨 샘플링 기반의 온라인 탐색과 분산 RL 학습을 지원하며, PPO·GRPO·R1-Zero 스타일 추론 학습까지 폭넓게 다룹니다. LLM 정렬 알고리즘을 빠르게 프로토타이핑하려는 연구자에게 특히 유용하며, Apache-2.0 라이선스로 공개되어 있습니다.
huggingface
SOTA 기계학습 모델을 위한 오픈소스 모델 정의 프레임워크
google-gemini
터미널에서 Gemini AI를 사용하는 Google 공식 CLI 에이전트
rasbt
PyTorch로 ChatGPT 스타일 LLM을 처음부터 구현하는 교육용 자료
punkpeye
LLM 도구 연동 표준 MCP 서버 큐레이션 모음