Z.ai GLM-5.2 공개: 753B 오픈웨이트 모델, GPT-5.5 코딩 벤치마크 초과
Z.ai(智谱AI)가 753B 파라미터의 오픈웨이트 LLM GLM-5.2를 공개했다. SWE-bench Pro 62.1점으로 GPT-5.5를 앞서며, 비용은 GPT-5.5의 6분의 1 수준이다.
Z.ai(智谱AI)가 753B 파라미터의 오픈웨이트 LLM GLM-5.2를 공개했다. SWE-bench Pro 62.1점으로 GPT-5.5를 앞서며, 비용은 GPT-5.5의 6분의 1 수준이다.
핵심 요약
Z.ai(智谱AI)가 2026년 6월 16~17일 오픈웨이트 대형 언어 모델 GLM-5.2를 공개했다. 7530억(753B) 파라미터 규모의 이 모델은 Hugging Face에서 즉시 다운로드할 수 있다. 장기 자율 코딩 벤치마크 여러 부문에서 오픈소스 모델 최고 성능을 달성했으며, GPT-5.5 대비 6분의 1 수준의 비용이 특징이다.
주요 기능 및 성능
1. SWE-bench Pro 62.1점
GLM-5.2는 SWE-bench Pro에서 62.1점을 기록했다. 이는 OpenAI GPT-5.5의 58.6점을 초과하는 수치다. SWE-bench는 실제 GitHub 이슈를 자동으로 해결하는 능력을 평가하는 코딩 벤치마크로, 소프트웨어 엔지니어링 실력을 측정하는 데 널리 활용된다.
2. 장기 자율 코딩 벤치마크 전 부문 오픈소스 1위
세 가지 장기 자율 코딩 벤치마크에서 모두 오픈소스 최고 성능을 달성했다.
| 벤치마크 | 특징 |
|---|---|
| FrontierSWE | 복잡한 실세계 코딩 작업 평가 |
| PostTrainBench | 사후 학습(post-training) 능력 평가 |
| SWE-Marathon | 장기 자율 코딩 지속성 평가 |
세 벤치마크 모두 단순 코드 생성을 넘어 장기적·자율적으로 소프트웨어 문제를 해결하는 능력을 측정한다. GLM-5.2는 오픈소스 모델 중 이 세 부문을 동시에 1위로 달성한 첫 번째 사례다.
3. 753B 오픈웨이트 공개
모델 가중치(weights)가 Hugging Face를 통해 공개되어 누구든 직접 다운로드하고 실행할 수 있다. 오픈웨이트 공개는 연구자, 기업, 개발자가 모델을 로컬 환경에서 운용하거나 파인튜닝할 수 있다는 의미다. 753B 파라미터는 현재 공개된 오픈웨이트 LLM 중 최대 규모에 속한다.
4. GPT-5.5 대비 1/6 비용
VentureBeat 보도에 따르면 GLM-5.2의 API 사용 비용은 GPT-5.5 대비 약 6분의 1 수준이다. 코딩 에이전트나 대규모 소프트웨어 자동화 파이프라인에서 비용 효율이 중요한 기업에게 실질적인 대안이 된다.
전문가 평가
오픈소스 AI 전문가 Simon Willison은 자신의 블로그에서 GLM-5.2를 "현재 가장 강력한 텍스트 전용 오픈웨이트 LLM"으로 평가했다. Willison은 AI 도구와 LLM 동향을 지속적으로 추적하는 것으로 알려져 있다.
사용성 분석
GLM-5.2는 두 가지 사용 경로가 있다. 첫째, Hugging Face에서 모델 가중치를 직접 다운로드해 자체 인프라에서 운용하는 방식이다. 753B 파라미터 모델을 로컬에서 실행하려면 대규모 GPU 클러스터가 필요하므로, 이 경로는 주로 연구 기관이나 클라우드 인프라를 보유한 기업에 적합하다.
둘째, Z.ai가 제공하는 API를 통해 접근하는 방식이다. GPT-5.5 대비 낮은 비용 덕분에 코딩 자동화 또는 에이전트 파이프라인을 구축하는 스타트업이나 개발자에게 실용적인 선택지다.
장기 자율 코딩 성능이 강조된 모델인 만큼, 단순 코드 완성보다 복잡한 이슈 해결, 멀티파일 수정, 테스트 작성 등 소프트웨어 엔지니어링 작업에서 강점이 있을 것으로 예상된다.
장점
- 오픈소스 코딩 벤치마크 최고 성능: FrontierSWE, PostTrainBench, SWE-Marathon 세 부문 오픈소스 1위
- GPT-5.5 초과 성능: SWE-bench Pro 62.1점으로 GPT-5.5(58.6점) 초과
- 낮은 비용: GPT-5.5 대비 약 1/6 수준
- 즉시 사용 가능: Hugging Face에서 가중치 바로 다운로드 가능
- 오픈웨이트 유연성: 파인튜닝 및 로컬 배포 가능
단점 및 한계
- 거대한 모델 크기: 753B 파라미터로 로컬 실행 시 대규모 GPU 인프라 필요
- 텍스트 전용: 멀티모달 능력에 대한 공식 벤치마크 정보 미확인
- 코딩 특화 검증: 코딩 외 일반 추론·지식 부문의 상세 비교 데이터 제한적
- 중국 기반 공급업체: 일부 기업에서 공급망 다양성 및 규정 준수 검토 필요
경쟁 모델 비교
| 항목 | GLM-5.2 | GPT-5.5 |
|---|---|---|
| SWE-bench Pro | 62.1점 | 58.6점 |
| 오픈웨이트 여부 | 공개 | 비공개 |
| 상대 비용 | 1/6 | 기준 |
| 파라미터 | 753B | 미공개 |
전망
GLM-5.2의 공개는 오픈소스 LLM 생태계에서 중요한 이정표다. 오픈웨이트 모델이 최신 클로즈드 소스 모델과 코딩 성능에서 대등하거나 일부 벤치마크에서 앞서는 것이 가능해졌음을 보여준다. 이는 AI 코딩 도구의 비용 경쟁을 가속화할 것으로 보인다.
Z.ai는 중국 AI 연구 기관으로, 글로벌 오픈소스 LLM 경쟁에서 점차 존재감을 높이고 있다. GLM 시리즈의 지속적인 발전은 Llama, Mistral 등 기존 오픈소스 LLM 커뮤니티에 새로운 경쟁 축을 형성한다.
결론
GLM-5.2는 코딩 자동화에 중점을 둔 오픈웨이트 LLM을 탐색하는 기업과 연구자에게 주목할 만한 선택지다. GPT-5.5 수준 이상의 코딩 성능을 6분의 1 비용으로 제공하며, 가중치를 직접 운용할 수 있다는 점이 핵심 강점이다. 대규모 GPU 인프라가 없는 개인 개발자에게는 API 접근이 현실적인 방법이다.
장점
- SWE-bench Pro 62.1점으로 GPT-5.5(58.6점) 초과
- 장기 자율 코딩 벤치마크 3종 오픈소스 전 부문 1위
- GPT-5.5 대비 약 1/6의 낮은 비용
- Hugging Face 즉시 다운로드 가능한 오픈웨이트 공개
- 파인튜닝 및 자체 인프라 배포 지원
단점/한계
- 753B 파라미터로 로컬 실행 시 대규모 GPU 클러스터 필요
- 멀티모달 능력 및 코딩 외 일반 추론 부문 상세 비교 데이터 제한적
- 중국 기반 공급업체로 일부 기업의 규정 준수 검토 필요
참고 자료
댓글0개
주요 기능/특징
1. SWE-bench Pro 62.1점 달성 (GPT-5.5의 58.6점 초과) 2. FrontierSWE, PostTrainBench, SWE-Marathon 세 벤치마크 오픈소스 1위 3. 753B 파라미터 오픈웨이트 공개 (Hugging Face 즉시 다운로드) 4. GPT-5.5 대비 약 1/6 수준의 API 비용 5. 장기 자율 코딩에 특화된 설계
핵심 인사이트
- 오픈웨이트 모델이 SWE-bench Pro에서 GPT-5.5를 초과한 것은 오픈소스 LLM 성능 진화의 중요한 사례다
- 753B 파라미터의 오픈웨이트 공개로 코딩 에이전트 분야에서 비용 경쟁이 심화될 것으로 보인다
- GPT-5.5 대비 1/6 비용은 대규모 코딩 자동화 파이프라인을 구축하는 기업에게 실질적 경쟁력이다
- FrontierSWE, PostTrainBench, SWE-Marathon 세 부문 동시 오픈소스 1위는 코딩 특화 최적화가 집중적으로 이루어진 결과다
- Simon Willison의 '현재 가장 강력한 텍스트 전용 오픈웨이트 LLM' 평가는 모델의 범용 텍스트 처리 능력도 높은 수준임을 시사한다
- 오픈웨이트 방식은 연구 기관과 기업이 모델을 직접 파인튜닝하고 내부 데이터로 커스터마이즈할 수 있는 유연성을 제공한다
- Z.ai의 이번 공개는 중국 AI 연구 기관이 글로벌 오픈소스 LLM 경쟁에서 기술적 우위를 점할 수 있음을 보여준다
이 리뷰가 유용했나요?
공유하기
관련 AI 리뷰
Alibaba Qwen-Robot Suite 출시: 로봇 전용 AI 모델 3종으로 구현 AI 시장 진출
Alibaba Tongyi Lab이 2026년 6월 16일 로봇 전용 AI 모델 스위트 Qwen-Robot Series를 공식 발표했다. 조작·내비게이션·세계 모델 3종으로 구성되며 RoboChallenge 1위를 달성했다. 물리 AI 시장 진출을 선언한 Alibaba의 구현 AI 전략이 주목된다.
Kimi K2.7 Code 출시: 1조 파라미터 오픈소스 코딩 특화 LLM
Moonshot AI가 2026년 6월 12일 Kimi K2.7 Code를 출시했다. K2.6 대비 코딩 벤치마크 21.8% 향상, 추론 토큰 30% 절감이 핵심이다. Modified MIT 라이선스로 HuggingFace에 가중치가 공개됐다.
NVIDIA Nemotron 3 Ultra 550B 출시: 오픈소스 에이전트용 최강 MoE 모델
NVIDIA가 6월 4일 550B 파라미터의 하이브리드 MoE 아키텍처 오픈소스 모델 Nemotron 3 Ultra를 출시했다. 100만 토큰 컨텍스트와 6배 추론 속도가 핵심 강점이다.
MiniMax M3 출시: 오픈웨이트 최초 100만 토큰 컨텍스트·멀티모달·코딩 삼박자
중국 AI 기업 MiniMax가 2026년 6월 1일 M3를 공개했다. SWE-Bench Pro 59.0%로 GPT-5.5를 추월한 오픈웨이트 모델로, MSA 아키텍처로 연산량을 1/20으로 줄이면서 1M 컨텍스트를 실현했다.
