Xiaomi MiMo-V2-Pro 공개: 1조 파라미터 MoE 모델로 글로벌 AI 시장에 도전하다
Xiaomi가 1조 파라미터 규모의 MoE 아키텍처 기반 대형 언어 모델 MiMo-V2-Pro를 공개했다. 추론 시 420억 파라미터를 활성화하며, 100만 토큰 컨텍스트를 지원한다. 글로벌 벤치마크 8위를 기록하며 87억 달러 AI 투자 계획도 함께 발표했다.
Xiaomi가 1조 파라미터 규모의 MoE 아키텍처 기반 대형 언어 모델 MiMo-V2-Pro를 공개했다. 추론 시 420억 파라미터를 활성화하며, 100만 토큰 컨텍스트를 지원한다. 글로벌 벤치마크 8위를 기록하며 87억 달러 AI 투자 계획도 함께 발표했다.
핵심 요약
Xiaomi CEO 레이쥔(Lei Jun)이 2026년 3월 19일 3년간 600억 위안(약 87억 달러) 규모의 AI 투자 계획과 함께 자체 개발 대형 언어 모델 MiMo-V2 시리즈를 공개했다. 플래그십 모델인 MiMo-V2-Pro는 1조 파라미터 규모의 Mixture-of-Experts(MoE) 아키텍처를 채택했으며, 추론 시 420억 파라미터를 활성화한다. Artificial Analysis 글로벌 벤치마크에서 8위를 기록하며 GPT-5.2와 Claude Opus 4.6에 근접한 성능을 보여줬다.
MiMo-V2 시리즈 구성
MiMo-V2-Pro (플래그십 베이스 모델)
MiMo-V2-Pro는 복잡한 논리 추론과 워크플로우 오케스트레이션에 최적화된 플래그십 모델이다.
| 사양 | 수치 |
|---|---|
| 총 파라미터 | 1조 (1 Trillion) |
| 활성 파라미터 | 420억 (42B, MoE) |
| 컨텍스트 윈도우 | 1,048,576 토큰 (1M) |
| 최대 출력 | 32,000 토큰 |
| 아키텍처 | Mixture-of-Experts (MoE) |
이 모델은 OpenRouter 플랫폼에 'Hunter Alpha'라는 익명으로 먼저 업로드되어 1.5조 토큰 이상을 처리하며 개발자들에게 검증받았다. 이후 Xiaomi가 정체를 공개하면서 화제가 됐다.
MiMo-V2-Omni (멀티모달 모델)
MiMo-V2-Omni는 텍스트, 이미지, 비디오, 10시간 이상의 연속 오디오를 네이티브로 처리할 수 있는 멀티모달 모델이다. OpenRouter에서 'Healer Alpha'라는 이름으로 테스트됐다.
MiMo-V2-TTS (음성 합성 모델)
MiMo-V2-TTS는 자연스러운 음성 합성에 특화된 모델로, Xiaomi 디바이스 생태계의 음성 인터랙션을 담당한다.
벤치마크 성적
| 벤치마크 | 점수 | 순위 |
|---|---|---|
| Artificial Analysis Intelligence Index | 49점 | 글로벌 8위 |
| PinchBench | 84.0 | 글로벌 3위 |
| ClawEval | 61.5 | 글로벌 3위 |
| GDPval-AA (에이전트 효과성) | Elo 1434 | 중국 모델 1위 |
| SWE-bench Verified (코딩) | Claude Sonnet 4.6 상회 | - |
특히 코딩 벤치마크에서 Claude Sonnet 4.6을 앞서는 결과를 보여주며, 에이전트 효과성 평가에서는 중국 모델 중 최고 성적을 기록했다.
API 가격
| 컨텍스트 범위 | 입력 가격 | 출력 가격 |
|---|---|---|
| 기본 | $1/1M 토큰 | $4.50/1M 토큰 |
| 256K-1M | $2/1M 토큰 | $6/1M 토큰 |
경쟁 모델 대비 약 6분의 1에서 7분의 1 수준의 가격이다. GPT-5.2나 Claude Opus 4.6과 유사한 성능을 훨씬 저렴한 비용으로 제공한다는 것이 핵심 경쟁력이다.
87억 달러 AI 투자 계획
Xiaomi는 향후 3년간 600억 위안(약 87억 달러)을 AI에 투자할 계획이다. 2024년에 이미 160억 위안 이상을 AI에 투자했다. 이 투자는 MiMo 모델 시리즈 개발, AI 에이전트 생태계 구축, 스마트폰-자동차-스마트홈을 연결하는 '인간-차-홈' 생태계 통합에 활용된다.
익명 데뷔 전략
MiMo-V2-Pro가 주목받은 배경에는 독특한 출시 전략이 있다. Xiaomi는 모델을 'Hunter Alpha'라는 익명으로 OpenRouter에 먼저 업로드했다. 브랜드 편견 없이 순수하게 성능으로 평가받기 위한 전략이었다. 1.5조 토큰 이상을 처리하며 개발자 커뮤니티에서 좋은 반응을 얻은 후에야 정체를 공개했다.
경쟁 구도
MiMo-V2-Pro의 등장으로 글로벌 LLM 시장의 경쟁이 더 치열해졌다. DeepSeek, Alibaba Qwen에 이어 Xiaomi까지 중국 기업들이 프론티어 모델 경쟁에 본격 합류했다. 특히 하드웨어(스마트폰, IoT) 제조사인 Xiaomi가 자체 LLM을 개발했다는 점에서, AI 모델 개발이 전통적인 AI 기업의 영역을 넘어서고 있음을 보여준다.
결론
Xiaomi MiMo-V2-Pro는 스마트폰 제조사가 프론티어 LLM 개발에서도 경쟁력을 갖출 수 있음을 입증한 사례다. 1조 파라미터 MoE 아키텍처, 100만 토큰 컨텍스트, 경쟁 모델 대비 6분의 1 수준의 가격은 개발자와 기업에게 매력적인 선택지를 제공한다. 다만 중국 기업이라는 지정학적 리스크와 글로벌 서비스 안정성은 지켜봐야 할 부분이다. 비용 효율적인 대형 언어 모델을 찾는 개발자에게 추천한다.
장점
- 1조 파라미터 규모에도 MoE 아키텍처로 합리적인 추론 비용을 실현했다
- 경쟁 모델 대비 6분의 1 수준의 파격적인 API 가격을 제공한다
- 코딩과 에이전트 벤치마크에서 글로벌 상위권 성적을 기록했다
- Pro, Omni, TTS 3종으로 다양한 사용 시나리오를 커버한다
단점/한계
- 중국 기업이라는 지정학적 리스크가 글로벌 기업 도입에 장벽이 될 수 있다
- 글로벌 서비스 인프라의 안정성이 아직 검증되지 않았다
- OpenRouter 이외의 글로벌 API 접근 경로가 제한적이다
- Artificial Analysis 글로벌 8위로 최상위 모델과는 성능 격차가 존재한다
참고 자료
댓글0개
주요 기능/특징
1. 1조 파라미터 MoE 아키텍처: 추론 시 420억 파라미터만 활성화하여 효율성과 성능을 동시에 확보 2. 100만 토큰 컨텍스트 윈도우: 대규모 코드베이스와 문서 분석에 적합한 초대형 컨텍스트 지원 3. 글로벌 벤치마크 상위권: Artificial Analysis 8위, PinchBench와 ClawEval에서 글로벌 3위 기록 4. 경쟁 모델 대비 6분의 1 가격: GPT-5.2, Claude Opus 4.6급 성능을 훨씬 저렴하게 제공 5. MiMo-V2 시리즈: Pro(텍스트), Omni(멀티모달), TTS(음성 합성) 3종 동시 공개
핵심 인사이트
- 스마트폰 제조사 Xiaomi가 프론티어 LLM 경쟁에 합류하며 AI 모델 개발의 진입 장벽이 낮아지고 있다
- 익명 출시(Hunter Alpha) 전략은 브랜드 편견 없이 모델 성능을 검증받는 새로운 방법론을 제시했다
- MoE 아키텍처의 채택은 1조 파라미터급 모델도 실용적 비용으로 운영할 수 있음을 보여준다
- 중국 LLM 시장이 DeepSeek, Qwen에 이어 Xiaomi까지 프론티어 모델 경쟁에 본격 참여하고 있다
- 87억 달러 AI 투자는 Xiaomi가 하드웨어 기업에서 AI 플랫폼 기업으로 전환하겠다는 의지를 보여준다
- 인간-차-홈 생태계 통합 전략은 AI 모델이 디바이스 생태계의 핵심 동력이 되는 방향을 제시한다
- 경쟁 모델 대비 6분의 1 가격은 API 시장에서 가격 경쟁을 더욱 가속화할 것이다
- SWE-bench에서 Claude Sonnet 4.6을 상회한 코딩 성능은 개발자 시장 공략의 무기가 된다
이 리뷰가 유용했나요?
공유하기
관련 AI 리뷰
Qwen 3.7-Max 공식 출시: 35시간 자율 실행, 에이전트 AI 시대의 새 기준
알리바바가 2026년 5월 20일 클라우드 서밋에서 Qwen 3.7-Max를 공식 발표했다. GPQA Diamond 92.4점, 1백만 토큰 컨텍스트, 최대 35시간 자율 실행으로 글로벌 에이전트 AI 경쟁에 새 기준을 제시했다.
xAI Grok Build 출시: 터미널 기반 AI 코딩 에이전트로 Claude Code에 도전장
xAI가 2026년 5월 14일 터미널 네이티브 AI 코딩 에이전트 'Grok Build'를 베타 출시했다. 최대 8개의 동시 에이전트, 200만 토큰 컨텍스트, ACP 지원으로 전문 개발자 시장 공략에 나섰다.
Mistral Medium 3.5 출시: 128B 오픈웨이트 모델 + 클라우드 코딩 에이전트
Mistral AI가 128B 오픈웨이트 모델 Medium 3.5(SWE-Bench 77.6%)와 클라우드 비동기 코딩 에이전트 Vibe Remote Agents를 발표했다. 4개 GPU 자체 호스팅과 수정 MIT 라이선스를 지원한다.
DeepSeek V4 Pro 심층 분석: GPT-5.5 제치는 오픈소스 코딩 괴물의 등장
DeepSeek이 2026년 4월 24일 V4 Pro를 출시했다. SWE-bench 80.6%, LiveCodeBench 93.5%로 서양 최고 모델들과 어깨를 나란히 하면서도 가격은 Claude Opus 4.7 대비 최대 35배 저렴하다.
