Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

Qwen3.5는 알리바바 클라우드 Qwen 팀이 개발한 차세대 대형 언어 모델로, 2026년 2월 16일 공개되었습니다. 총 397B 파라미터 중 17B만 활성화하는 Sparse MoE(Mixture of Experts) 아키텍처와 Gated Delta Networks를 결합한 하이브리드 구조로, 이전 세대 대비 8~19배 추론 효율을 달성했습니다. 텍스트, 이미지, 오디오, 비디오를 통합 처리하는 네이티브 멀티모달 모델이며, 기본 262K에서 최대 1M 토큰 컨텍스트를 지원합니다. 201개 언어를 지원하고, MMLU-Pro 87.8, LiveCodeBench v6 83.6 등 주요 벤치마크에서 최상위 성능을 기록했습니다.
huggingface
SOTA 기계학습 모델을 위한 오픈소스 모델 정의 프레임워크
rasbt
PyTorch로 ChatGPT 스타일 LLM을 처음부터 구현하는 교육용 자료

vllm-project
고성능 LLM 추론 및 서빙 엔진
hiyouga
100개 이상 LLM/VLM 통합 파인튜닝 프레임워크