2026.06.05
93
0
0
IT 뉴스NEW

마이크로소프트 MAI-Thinking-1·MAI-Code-1-Flash 출시: OpenAI 독립 선언

마이크로소프트가 2026년 6월 2일 Build 컨퍼런스에서 자체 개발 AI 모델 7종을 발표했다. MAI-Thinking-1은 수학 추론에서 AIME 2025 97%를 기록하고, MAI-Code-1-Flash는 GitHub Copilot에 즉시 탑재됐다.

#Microsoft#MAI#MAI-Thinking-1#MAI-Code-1-Flash#GitHub Copilot
마이크로소프트 MAI-Thinking-1·MAI-Code-1-Flash 출시: OpenAI 독립 선언
AI 핵심 요약

마이크로소프트가 2026년 6월 2일 Build 컨퍼런스에서 자체 개발 AI 모델 7종을 발표했다. MAI-Thinking-1은 수학 추론에서 AIME 2025 97%를 기록하고, MAI-Code-1-Flash는 GitHub Copilot에 즉시 탑재됐다.

핵심 요약

마이크로소프트가 2026년 6월 2일 Build 2026 개발자 컨퍼런스에서 자체 개발 AI 모델 7종을 일제히 공개하며 OpenAI 의존도를 줄이겠다는 의지를 공식화했다. 이번 발표는 Mustafa Suleyman Microsoft AI 최고책임자의 진두지휘 아래 이루어졌으며, 추론·코딩·이미지·음성·전사(transcription) 분야를 망라한다.

핵심 모델: MAI-Thinking-1

MAI-Thinking-1은 마이크로소프트가 처음으로 공개한 대형 추론 모델이다. Mixture of Experts(MoE) 아키텍처를 채택해 전체 파라미터 수는 약 1조 개이지만, 입력당 활성화되는 파라미터는 350억 개에 불과해 추론 비용이 크게 낮다. 컨텍스트 윈도우는 256,000 토큰을 지원한다.

벤치마크 성적은 인상적이다. 수학 추론 능력을 측정하는 AIME 2025에서 97.0%, AIME 2026에서 94.5%를 기록했다. 코딩 벤치마크인 SWE-Bench Pro에서는 Claude Opus 4.6과 동등한 성과를 냈으며, 서지 리서치가 진행한 블라인드 인간 비교 평가에서는 Claude Sonnet 4.6보다 선호되는 것으로 나타났다.

마이크로소프트는 학습 데이터 측면에서도 독립성을 강조했다. 제3자 모델로부터의 증류(distillation) 없이 상업적으로 라이선스된 데이터와 공개 웹 크롤 데이터를 직접 정제해 학습시켰다고 밝혔다. 현재 MAI-Thinking-1은 Microsoft Foundry를 통한 제한적 프리뷰로 제공되며, 관심 있는 개발자는 사전 등록을 통해 테스트 기회를 신청할 수 있다.

즉시 배포: MAI-Code-1-Flash

MAI-Code-1-Flash는 GitHub Copilot 개인 사용자에게 즉시 배포된 코딩 전문 모델이다. MoE 구조로 활성화 파라미터는 50억 개이며 전체 파라미터는 1,370억 개다. GitHub Copilot 생산 환경의 하네스와 직접 연계해 학습돼, 실제 개발 워크플로에 최적화됐다는 점이 특징이다.

공개된 벤치마크 결과에 따르면 MAI-Code-1-Flash는 Claude Haiku 4.5 대비 코딩 4개 벤치마크 전체에서 우위를 보였다. SWE-Bench Pro에서 51.2% 대 35.2%로 16포인트 차이를 기록했고, 명령 이행 능력 지표인 IF Bench에서는 28.9포인트 앞섰다. 마이크로소프트는 MAI-Code-1-Flash가 복잡한 문제를 해결하는 데 경쟁 모델보다 최대 60% 더 적은 토큰을 사용한다고 밝혔다.

VS Code에서 모델 선택기(model picker) 또는 자동 선택 모드를 통해 추가 설정 없이 사용할 수 있다.

나머지 MAI 모델 5종

이번에 함께 발표된 모델들은 다음과 같다.

  • MAI-Image-2.5: 텍스트-이미지 생성과 이미지 편집을 동시에 지원하는 첫 마이크로소프트 멀티모달 모델. Flash 경량 버전도 포함됐다.
  • MAI-Transcribe-1.5: 43개 언어를 지원하며 "세계 최고의 전사 모델"을 표방하는 음성-텍스트 변환 모델.
  • MAI-Voice-2: 15개 이상 언어를 지원하는 음성 합성 모델. 신규 음성 옵션이 추가됐다.
  • MAI-Voice-2-Flash: Voice-2의 경량·저비용 버전. 출시 예정.

모델 접근 경로는 Microsoft Foundry, OpenRouter, Fireworks, Baseten 등 다양한 플랫폼을 통해 제공된다.

시장 파장: OpenAI 의존도 탈피

이번 발표의 핵심 메시지는 "OpenAI 독립"이다. 마이크로소프트는 수십억 달러를 OpenAI에 투자했지만, 자체 모델 라인업이 없어 특정 파트너사 결정에 종속될 위험이 있었다. MAI 시리즈는 그 대안이다.

개발자 관점에서도 긍정적인 신호다. 마이크로소프트의 자체 모델이 경쟁력 있는 성능을 유지한다면, OpenAI나 Anthropic 모델 대비 낮은 비용으로 동급 성능을 제공할 수 있게 된다. 특히 GitHub Copilot에 즉시 탑재된 MAI-Code-1-Flash는 수천만 명의 개발자에게 직접 영향을 준다.

한계와 미지수

마이크로소프트는 이번 발표에서 가격 정보를 공개하지 않았다. MAI-Thinking-1은 아직 제한적 프리뷰 단계여서 일반 개발자의 접근이 불가하다. 벤치마크 수치는 자체 제공 데이터이므로 독립 검증이 필요하다는 지적도 있다.

결론

MAI-Thinking-1과 MAI-Code-1-Flash는 마이크로소프트가 AI 인프라의 수직 통합을 본격 추진한다는 신호탄이다. 추론·코딩 벤치마크에서 Anthropic 모델과 직접 비교가 가능한 수준으로 진입했다는 점에서 의미가 크다. GitHub Copilot 사용자라면 MAI-Code-1-Flash를 즉시 써볼 수 있다. MAI-Thinking-1은 가격 공개와 일반 출시 이후 실제 성능을 평가할 수 있을 것이다.

장점

  • MAI-Code-1-Flash가 GitHub Copilot에 즉시 탑재돼 추가 설정 없이 사용 가능
  • AIME 2025·2026 수학 추론 벤치마크에서 업계 최고 수준 성적 발표
  • SWE-Bench Pro 코딩 성능에서 동급 경쟁 모델 대비 60% 토큰 절약
  • 추론·코딩·이미지·음성·전사 전 영역 커버로 단일 플랫폼 통합 가능
  • OpenAI 비의존 자체 학습 데이터 사용으로 라이선스 리스크 최소화

단점/한계

  • MAI-Thinking-1은 제한적 프리뷰 단계로 일반 개발자 접근 불가
  • 가격 정보가 전혀 공개되지 않아 실제 경쟁력 비교 불가
  • 벤치마크 수치가 자체 제공 데이터이므로 독립 검증 필요
  • MAI-Voice-2-Flash 등 일부 모델은 출시 예정 상태로 실제 출시 시기 불확실

댓글0

주요 기능/특징

1. MAI-Thinking-1: MoE 아키텍처 1조 파라미터(활성화 350억), AIME 2025 97.0%, SWE-Bench Pro에서 Claude Opus 4.6 동등 2. MAI-Code-1-Flash: MoE 구조 활성화 50억 파라미터, SWE-Bench Pro 51.2%(+16포인트 vs Haiku 4.5), 60% 토큰 절약 3. 즉시 배포: VS Code GitHub Copilot에 MAI-Code-1-Flash 즉시 적용 가능 4. 7종 패키지: 추론·코딩·이미지·전사·음성 분야 동시 커버 5. OpenAI 비의존: 제3자 모델 증류 없이 마이크로소프트 독자 학습 데이터 사용

핵심 인사이트

  • 마이크로소프트가 처음으로 자체 대형 추론 모델(MAI-Thinking-1)을 공개하면서 OpenAI와의 파트너십 의존도를 전략적으로 줄이기 시작했다.
  • MAI-Code-1-Flash가 GitHub Copilot 수천만 명 사용자에게 즉시 배포된 것은 실제 시장 침투 속도 면에서 매우 공격적인 전략이다.
  • AIME 2025 97% 수학 추론 성적은 GPT-5.5 및 Claude Opus 4.8과 경쟁할 수 있는 수준이라는 마이크로소프트 측 주장을 뒷받침한다.
  • MoE 아키텍처 활용으로 전체 파라미터 규모 대비 추론 비용을 대폭 낮춘 것은 경제성 측면에서 중요한 설계 결정이다.
  • 이번 발표로 AI 모델 시장은 OpenAI·Anthropic·Google 3강 구도에서 Microsoft가 독자 세력으로 부상하는 4자 경쟁 구도로 재편될 가능성이 높아졌다.
  • 가격 미공개와 MAI-Thinking-1의 제한적 프리뷰 상태는 실제 경쟁력 검증까지 시간이 필요함을 시사한다.
  • 7종 모델을 동시에 공개한 것은 단일 모델 경쟁이 아닌 통합 AI 스택 구축을 목표로 한다는 신호다.

이 리뷰가 유용했나요?

공유하기