Xiaomi MiMo-V2-Pro 공개: 1조 파라미터 MoE 모델로 글로벌 AI 시장에 도전하다
Xiaomi가 1조 파라미터 규모의 MoE 아키텍처 기반 대형 언어 모델 MiMo-V2-Pro를 공개했다. 추론 시 420억 파라미터를 활성화하며, 100만 토큰 컨텍스트를 지원한다. 글로벌 벤치마크 8위를 기록하며 87억 달러 AI 투자 계획도 함께 발표했다.
Xiaomi가 1조 파라미터 규모의 MoE 아키텍처 기반 대형 언어 모델 MiMo-V2-Pro를 공개했다. 추론 시 420억 파라미터를 활성화하며, 100만 토큰 컨텍스트를 지원한다. 글로벌 벤치마크 8위를 기록하며 87억 달러 AI 투자 계획도 함께 발표했다.
핵심 요약
Xiaomi CEO 레이쥔(Lei Jun)이 2026년 3월 19일 3년간 600억 위안(약 87억 달러) 규모의 AI 투자 계획과 함께 자체 개발 대형 언어 모델 MiMo-V2 시리즈를 공개했다. 플래그십 모델인 MiMo-V2-Pro는 1조 파라미터 규모의 Mixture-of-Experts(MoE) 아키텍처를 채택했으며, 추론 시 420억 파라미터를 활성화한다. Artificial Analysis 글로벌 벤치마크에서 8위를 기록하며 GPT-5.2와 Claude Opus 4.6에 근접한 성능을 보여줬다.
MiMo-V2 시리즈 구성
MiMo-V2-Pro (플래그십 베이스 모델)
MiMo-V2-Pro는 복잡한 논리 추론과 워크플로우 오케스트레이션에 최적화된 플래그십 모델이다.
| 사양 | 수치 |
|---|---|
| 총 파라미터 | 1조 (1 Trillion) |
| 활성 파라미터 | 420억 (42B, MoE) |
| 컨텍스트 윈도우 | 1,048,576 토큰 (1M) |
| 최대 출력 | 32,000 토큰 |
| 아키텍처 | Mixture-of-Experts (MoE) |
이 모델은 OpenRouter 플랫폼에 'Hunter Alpha'라는 익명으로 먼저 업로드되어 1.5조 토큰 이상을 처리하며 개발자들에게 검증받았다. 이후 Xiaomi가 정체를 공개하면서 화제가 됐다.
MiMo-V2-Omni (멀티모달 모델)
MiMo-V2-Omni는 텍스트, 이미지, 비디오, 10시간 이상의 연속 오디오를 네이티브로 처리할 수 있는 멀티모달 모델이다. OpenRouter에서 'Healer Alpha'라는 이름으로 테스트됐다.
MiMo-V2-TTS (음성 합성 모델)
MiMo-V2-TTS는 자연스러운 음성 합성에 특화된 모델로, Xiaomi 디바이스 생태계의 음성 인터랙션을 담당한다.
벤치마크 성적
| 벤치마크 | 점수 | 순위 |
|---|---|---|
| Artificial Analysis Intelligence Index | 49점 | 글로벌 8위 |
| PinchBench | 84.0 | 글로벌 3위 |
| ClawEval | 61.5 | 글로벌 3위 |
| GDPval-AA (에이전트 효과성) | Elo 1434 | 중국 모델 1위 |
| SWE-bench Verified (코딩) | Claude Sonnet 4.6 상회 | - |
특히 코딩 벤치마크에서 Claude Sonnet 4.6을 앞서는 결과를 보여주며, 에이전트 효과성 평가에서는 중국 모델 중 최고 성적을 기록했다.
API 가격
| 컨텍스트 범위 | 입력 가격 | 출력 가격 |
|---|---|---|
| 기본 | $1/1M 토큰 | $4.50/1M 토큰 |
| 256K-1M | $2/1M 토큰 | $6/1M 토큰 |
경쟁 모델 대비 약 6분의 1에서 7분의 1 수준의 가격이다. GPT-5.2나 Claude Opus 4.6과 유사한 성능을 훨씬 저렴한 비용으로 제공한다는 것이 핵심 경쟁력이다.
87억 달러 AI 투자 계획
Xiaomi는 향후 3년간 600억 위안(약 87억 달러)을 AI에 투자할 계획이다. 2024년에 이미 160억 위안 이상을 AI에 투자했다. 이 투자는 MiMo 모델 시리즈 개발, AI 에이전트 생태계 구축, 스마트폰-자동차-스마트홈을 연결하는 '인간-차-홈' 생태계 통합에 활용된다.
익명 데뷔 전략
MiMo-V2-Pro가 주목받은 배경에는 독특한 출시 전략이 있다. Xiaomi는 모델을 'Hunter Alpha'라는 익명으로 OpenRouter에 먼저 업로드했다. 브랜드 편견 없이 순수하게 성능으로 평가받기 위한 전략이었다. 1.5조 토큰 이상을 처리하며 개발자 커뮤니티에서 좋은 반응을 얻은 후에야 정체를 공개했다.
경쟁 구도
MiMo-V2-Pro의 등장으로 글로벌 LLM 시장의 경쟁이 더 치열해졌다. DeepSeek, Alibaba Qwen에 이어 Xiaomi까지 중국 기업들이 프론티어 모델 경쟁에 본격 합류했다. 특히 하드웨어(스마트폰, IoT) 제조사인 Xiaomi가 자체 LLM을 개발했다는 점에서, AI 모델 개발이 전통적인 AI 기업의 영역을 넘어서고 있음을 보여준다.
결론
Xiaomi MiMo-V2-Pro는 스마트폰 제조사가 프론티어 LLM 개발에서도 경쟁력을 갖출 수 있음을 입증한 사례다. 1조 파라미터 MoE 아키텍처, 100만 토큰 컨텍스트, 경쟁 모델 대비 6분의 1 수준의 가격은 개발자와 기업에게 매력적인 선택지를 제공한다. 다만 중국 기업이라는 지정학적 리스크와 글로벌 서비스 안정성은 지켜봐야 할 부분이다. 비용 효율적인 대형 언어 모델을 찾는 개발자에게 추천한다.
장점
- 1조 파라미터 규모에도 MoE 아키텍처로 합리적인 추론 비용을 실현했다
- 경쟁 모델 대비 6분의 1 수준의 파격적인 API 가격을 제공한다
- 코딩과 에이전트 벤치마크에서 글로벌 상위권 성적을 기록했다
- Pro, Omni, TTS 3종으로 다양한 사용 시나리오를 커버한다
단점/한계
- 중국 기업이라는 지정학적 리스크가 글로벌 기업 도입에 장벽이 될 수 있다
- 글로벌 서비스 인프라의 안정성이 아직 검증되지 않았다
- OpenRouter 이외의 글로벌 API 접근 경로가 제한적이다
- Artificial Analysis 글로벌 8위로 최상위 모델과는 성능 격차가 존재한다
참고 자료
댓글0개
주요 기능/특징
1. 1조 파라미터 MoE 아키텍처: 추론 시 420억 파라미터만 활성화하여 효율성과 성능을 동시에 확보 2. 100만 토큰 컨텍스트 윈도우: 대규모 코드베이스와 문서 분석에 적합한 초대형 컨텍스트 지원 3. 글로벌 벤치마크 상위권: Artificial Analysis 8위, PinchBench와 ClawEval에서 글로벌 3위 기록 4. 경쟁 모델 대비 6분의 1 가격: GPT-5.2, Claude Opus 4.6급 성능을 훨씬 저렴하게 제공 5. MiMo-V2 시리즈: Pro(텍스트), Omni(멀티모달), TTS(음성 합성) 3종 동시 공개
핵심 인사이트
- 스마트폰 제조사 Xiaomi가 프론티어 LLM 경쟁에 합류하며 AI 모델 개발의 진입 장벽이 낮아지고 있다
- 익명 출시(Hunter Alpha) 전략은 브랜드 편견 없이 모델 성능을 검증받는 새로운 방법론을 제시했다
- MoE 아키텍처의 채택은 1조 파라미터급 모델도 실용적 비용으로 운영할 수 있음을 보여준다
- 중국 LLM 시장이 DeepSeek, Qwen에 이어 Xiaomi까지 프론티어 모델 경쟁에 본격 참여하고 있다
- 87억 달러 AI 투자는 Xiaomi가 하드웨어 기업에서 AI 플랫폼 기업으로 전환하겠다는 의지를 보여준다
- 인간-차-홈 생태계 통합 전략은 AI 모델이 디바이스 생태계의 핵심 동력이 되는 방향을 제시한다
- 경쟁 모델 대비 6분의 1 가격은 API 시장에서 가격 경쟁을 더욱 가속화할 것이다
- SWE-bench에서 Claude Sonnet 4.6을 상회한 코딩 성능은 개발자 시장 공략의 무기가 된다
이 리뷰가 유용했나요?
공유하기
관련 AI 리뷰
Alibaba Qwen3.6-Plus 출시: 에이전틱 코딩에서 Claude를 위협하다
Alibaba가 에이전틱 AI 코딩에 특화된 Qwen3.6-Plus를 출시했다. Terminal-Bench 2.0에서 Claude Opus 4.5를 넘어서고, 100만 토큰 컨텍스트와 멀티모달 인식을 기본 탑재했다.
Mistral AI, $8.3억 부채 금융 조달: 13,800대 Nvidia GPU로 유럽 AI 자립 가속
프랑스 AI 스타트업 Mistral이 7개 은행에서 $8.3억 부채 금융을 확보했다. 파리 근교에 Nvidia GB300 13,800대 규모 데이터센터를 구축하며, 유럽 AI 인프라 자립에 나선다.
Mistral Voxtral TTS 출시: ElevenLabs에 도전하는 오픈소스 음성 합성 모델
Mistral AI가 4B 파라미터 오픈소스 TTS 모델 Voxtral을 출시했다. 9개 언어를 지원하며, 3초 음성 샘플로 화자 복제가 가능하고, ElevenLabs 대비 우수한 자연스러움을 보인다.
MiniMax M2.7 출시: 스스로 진화하는 AI 모델의 등장
MiniMax가 자기진화(self-evolving) 능력을 갖춘 M2.7 모델을 출시했다. SWE-Pro 56.22%, GDPval-AA 1495 ELO를 달성하며, 100회 이상 자율 최적화로 30% 성능 향상을 기록했다.
