AI 세상을 읽는
가장 빠른 방법
Claude, Gemini, GPT 등 주요 AI/LLM의 최신 뉴스와
심층 분석 리뷰를 매일 전해드립니다.
기타 LLM 리뷰
총 36개의 리뷰
Grok 4.20 0309 v2 출시: xAI 최신 추론 모델의 성능과 실체
xAI가 2026년 4월 7일 Grok 4.20 0309 v2(Reasoning) 업데이트를 공개했다. 185토큰/초의 빠른 속도와 $2/$6(입출력 100만 토큰) 경쟁적 가격으로 추론 모델 시장에 도전장을 내밀었다.
Meta Muse Spark 출시: 슈퍼인텔리전스 연구소의 첫 모델, 폐쇄 전략으로의 전환
Meta가 4월 8일 Muse Spark를 발표했다. Meta Superintelligence Labs의 첫 모델로 Humanity's Last Exam 58%를 달성했다. Llama의 오픈소스 전략을 포기하고 폐쇄 모델로 전환한 점이 핵심 변화다.
GLM-5.1 출시: SWE-Bench Pro 1위 달성한 오픈소스 코딩 AI
Z.ai(구 Zhipu AI)가 4월 7일 GLM-5.1을 오픈소스로 공개했다. MIT 라이선스로 SWE-Bench Pro 58.4점을 기록해 Claude Opus 4.6과 GPT-5.4를 제치고 코딩 벤치마크 1위에 올랐다.
Alibaba Qwen3.6-Plus 출시: 에이전틱 코딩에서 Claude를 위협하다
Alibaba가 에이전틱 AI 코딩에 특화된 Qwen3.6-Plus를 출시했다. Terminal-Bench 2.0에서 Claude Opus 4.5를 넘어서고, 100만 토큰 컨텍스트와 멀티모달 인식을 기본 탑재했다.
Mistral AI, $8.3억 부채 금융 조달: 13,800대 Nvidia GPU로 유럽 AI 자립 가속
프랑스 AI 스타트업 Mistral이 7개 은행에서 $8.3억 부채 금융을 확보했다. 파리 근교에 Nvidia GB300 13,800대 규모 데이터센터를 구축하며, 유럽 AI 인프라 자립에 나선다.
Mistral Voxtral TTS 출시: ElevenLabs에 도전하는 오픈소스 음성 합성 모델
Mistral AI가 4B 파라미터 오픈소스 TTS 모델 Voxtral을 출시했다. 9개 언어를 지원하며, 3초 음성 샘플로 화자 복제가 가능하고, ElevenLabs 대비 우수한 자연스러움을 보인다.
MiniMax M2.7 출시: 스스로 진화하는 AI 모델의 등장
MiniMax가 자기진화(self-evolving) 능력을 갖춘 M2.7 모델을 출시했다. SWE-Pro 56.22%, GDPval-AA 1495 ELO를 달성하며, 100회 이상 자율 최적화로 30% 성능 향상을 기록했다.
Xiaomi MiMo-V2-Pro 공개: 1조 파라미터 MoE 모델로 글로벌 AI 시장에 도전하다
Xiaomi가 1조 파라미터 규모의 MoE 아키텍처 기반 대형 언어 모델 MiMo-V2-Pro를 공개했다. 추론 시 420억 파라미터를 활성화하며, 100만 토큰 컨텍스트를 지원한다. 글로벌 벤치마크 8위를 기록하며 87억 달러 AI 투자 계획도 함께 발표했다.
MiroThinker-H1 출시: 검증 중심 추론으로 GPT, Claude, Gemini를 넘다
MiroMind가 3월 16일 검증 중심 AI 리서치 에이전트 MiroThinker-H1을 출시했다. BrowseComp 88.2점으로 Gemini 3.1 Pro, Claude Opus 4.6, GPT-5.4를 모두 제치며 새로운 SOTA를 달성했다.
Moonshot AI, 기업가치 $18B 돌파: Kimi 챗봇의 폭발적 성장이 이끈 중국 AI 붐
중국 AI 스타트업 Moonshot AI가 약 10억 달러 규모 펀딩을 추진하며 기업가치 180억 달러를 달성했다. 3개월 만에 기업가치가 4배 이상 급등한 배경을 분석한다.
GLM-5: Huawei 칩으로 훈련한 744B 오픈소스 MoE 모델의 등장
중국 Zhipu AI가 744B 파라미터 MoE 모델 GLM-5를 MIT 라이선스로 공개했다. Huawei Ascend 910B 칩 10만 개로 훈련하여 NVIDIA 없이 프론티어급 성능을 달성했으며, SWE-bench 77.8%, Humanity's Last Exam 50.4%를 기록했다.
Qwen 3.5 Small 시리즈 출시: 9B 모델이 120B를 이기는 시대
Alibaba Qwen 팀이 0.8B부터 9B까지 4개 모델로 구성된 Qwen 3.5 Small 시리즈를 출시했다. 9B 모델이 GPQA Diamond에서 81.7%를 기록하며 OpenAI gpt-oss-120B를 능가했다. 네이티브 멀티모달과 262K 컨텍스트 윈도우를 지원하는 온디바이스 AI의 새 기준이다.
