TrendingFeatured

Qwen3.5

QwenLMApache-2.02026.02.17

LLM513 Stars20 Forks19.6K Downloads7.7천 조회

Qwen3.5는 알리바바 클라우드 Qwen 팀이 개발한 차세대 대형 언어 모델로, 2026년 2월 16일 공개되었습니다. 총 397B 파라미터 중 17B만 활성화하는 Sparse MoE(Mixture of Experts) 아키텍처와 Gated Delta Networks를 결합한 하이브리드 구조로, 이전 세대 대비 8~19배 추론 효율을 달성했습니다. 텍스트, 이미지, 오디오, 비디오를 통합 처리하는 네이티브 멀티모달 모델이며, 기본 262K에서 최대 1M 토큰 컨텍스트를 지원합니다. 201개 언어를 지원하고, MMLU-Pro 87.8, LiveCodeBench v6 83.6 등 주요 벤치마크에서 최상위 성능을 기록했습니다.

주요 특징

하이브리드 아키텍처: Gated Delta Networks + Sparse MoE (512개 전문가 중 10개 라우팅 + 1개 공유 활성화)
네이티브 멀티모달: 텍스트, 이미지, 오디오, 비디오를 처음부터 통합 학습한 단일 모델
확장 컨텍스트: 기본 262K 토큰, YaRN으로 최대 1M 토큰까지 확장 가능
추론 효율성: 이전 세대 대비 8~19배 추론 효율 향상, 운용 비용 60% 절감
201개 언어 지원: 전 세계 언어와 방언을 포괄하는 다국어 지원

Open Source

Qwen3.5

주요 특징

태그

관련 프로젝트

Hugging Face Transformers

Gemini CLI

LLMs from Scratch

Awesome MCP Servers