GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
LLM 시스템을 테스트하기 위한 오픈소스 평가 프레임워크로, Pytest와 유사하지만 LLM 출력 평가에 특화되어 있습니다. G-Eval, DAG, RAG 메트릭 등 종합적인 평가 지표와 40개 이상의 보안 취약점 테스트를 위한 레드팀 기능을 제공합니다.
microsoft
Microsoft의 1비트 LLM 공식 추론 프레임워크
Zhejiang University NLP
AAAI 2026, GPT-5 능가하는 데이터 분석 AI