2026.06.22
2
0
0
기타 LLMNEW

Z.ai GLM-5.2 공개: 753B 오픈웨이트 모델, GPT-5.5 코딩 벤치마크 초과

Z.ai(智谱AI)가 753B 파라미터의 오픈웨이트 LLM GLM-5.2를 공개했다. SWE-bench Pro 62.1점으로 GPT-5.5를 앞서며, 비용은 GPT-5.5의 6분의 1 수준이다.

#GLM-5.2#Z.ai#智谱AI#오픈웨이트#LLM
Z.ai GLM-5.2 공개: 753B 오픈웨이트 모델, GPT-5.5 코딩 벤치마크 초과
AI 핵심 요약

Z.ai(智谱AI)가 753B 파라미터의 오픈웨이트 LLM GLM-5.2를 공개했다. SWE-bench Pro 62.1점으로 GPT-5.5를 앞서며, 비용은 GPT-5.5의 6분의 1 수준이다.

핵심 요약

Z.ai(智谱AI)가 2026년 6월 16~17일 오픈웨이트 대형 언어 모델 GLM-5.2를 공개했다. 7530억(753B) 파라미터 규모의 이 모델은 Hugging Face에서 즉시 다운로드할 수 있다. 장기 자율 코딩 벤치마크 여러 부문에서 오픈소스 모델 최고 성능을 달성했으며, GPT-5.5 대비 6분의 1 수준의 비용이 특징이다.

주요 기능 및 성능

1. SWE-bench Pro 62.1점

GLM-5.2는 SWE-bench Pro에서 62.1점을 기록했다. 이는 OpenAI GPT-5.5의 58.6점을 초과하는 수치다. SWE-bench는 실제 GitHub 이슈를 자동으로 해결하는 능력을 평가하는 코딩 벤치마크로, 소프트웨어 엔지니어링 실력을 측정하는 데 널리 활용된다.

2. 장기 자율 코딩 벤치마크 전 부문 오픈소스 1위

세 가지 장기 자율 코딩 벤치마크에서 모두 오픈소스 최고 성능을 달성했다.

벤치마크특징
FrontierSWE복잡한 실세계 코딩 작업 평가
PostTrainBench사후 학습(post-training) 능력 평가
SWE-Marathon장기 자율 코딩 지속성 평가

세 벤치마크 모두 단순 코드 생성을 넘어 장기적·자율적으로 소프트웨어 문제를 해결하는 능력을 측정한다. GLM-5.2는 오픈소스 모델 중 이 세 부문을 동시에 1위로 달성한 첫 번째 사례다.

3. 753B 오픈웨이트 공개

모델 가중치(weights)가 Hugging Face를 통해 공개되어 누구든 직접 다운로드하고 실행할 수 있다. 오픈웨이트 공개는 연구자, 기업, 개발자가 모델을 로컬 환경에서 운용하거나 파인튜닝할 수 있다는 의미다. 753B 파라미터는 현재 공개된 오픈웨이트 LLM 중 최대 규모에 속한다.

4. GPT-5.5 대비 1/6 비용

VentureBeat 보도에 따르면 GLM-5.2의 API 사용 비용은 GPT-5.5 대비 약 6분의 1 수준이다. 코딩 에이전트나 대규모 소프트웨어 자동화 파이프라인에서 비용 효율이 중요한 기업에게 실질적인 대안이 된다.

전문가 평가

오픈소스 AI 전문가 Simon Willison은 자신의 블로그에서 GLM-5.2를 "현재 가장 강력한 텍스트 전용 오픈웨이트 LLM"으로 평가했다. Willison은 AI 도구와 LLM 동향을 지속적으로 추적하는 것으로 알려져 있다.

사용성 분석

GLM-5.2는 두 가지 사용 경로가 있다. 첫째, Hugging Face에서 모델 가중치를 직접 다운로드해 자체 인프라에서 운용하는 방식이다. 753B 파라미터 모델을 로컬에서 실행하려면 대규모 GPU 클러스터가 필요하므로, 이 경로는 주로 연구 기관이나 클라우드 인프라를 보유한 기업에 적합하다.

둘째, Z.ai가 제공하는 API를 통해 접근하는 방식이다. GPT-5.5 대비 낮은 비용 덕분에 코딩 자동화 또는 에이전트 파이프라인을 구축하는 스타트업이나 개발자에게 실용적인 선택지다.

장기 자율 코딩 성능이 강조된 모델인 만큼, 단순 코드 완성보다 복잡한 이슈 해결, 멀티파일 수정, 테스트 작성 등 소프트웨어 엔지니어링 작업에서 강점이 있을 것으로 예상된다.

장점

  1. 오픈소스 코딩 벤치마크 최고 성능: FrontierSWE, PostTrainBench, SWE-Marathon 세 부문 오픈소스 1위
  2. GPT-5.5 초과 성능: SWE-bench Pro 62.1점으로 GPT-5.5(58.6점) 초과
  3. 낮은 비용: GPT-5.5 대비 약 1/6 수준
  4. 즉시 사용 가능: Hugging Face에서 가중치 바로 다운로드 가능
  5. 오픈웨이트 유연성: 파인튜닝 및 로컬 배포 가능

단점 및 한계

  1. 거대한 모델 크기: 753B 파라미터로 로컬 실행 시 대규모 GPU 인프라 필요
  2. 텍스트 전용: 멀티모달 능력에 대한 공식 벤치마크 정보 미확인
  3. 코딩 특화 검증: 코딩 외 일반 추론·지식 부문의 상세 비교 데이터 제한적
  4. 중국 기반 공급업체: 일부 기업에서 공급망 다양성 및 규정 준수 검토 필요

경쟁 모델 비교

항목GLM-5.2GPT-5.5
SWE-bench Pro62.1점58.6점
오픈웨이트 여부공개비공개
상대 비용1/6기준
파라미터753B미공개

전망

GLM-5.2의 공개는 오픈소스 LLM 생태계에서 중요한 이정표다. 오픈웨이트 모델이 최신 클로즈드 소스 모델과 코딩 성능에서 대등하거나 일부 벤치마크에서 앞서는 것이 가능해졌음을 보여준다. 이는 AI 코딩 도구의 비용 경쟁을 가속화할 것으로 보인다.

Z.ai는 중국 AI 연구 기관으로, 글로벌 오픈소스 LLM 경쟁에서 점차 존재감을 높이고 있다. GLM 시리즈의 지속적인 발전은 Llama, Mistral 등 기존 오픈소스 LLM 커뮤니티에 새로운 경쟁 축을 형성한다.

결론

GLM-5.2는 코딩 자동화에 중점을 둔 오픈웨이트 LLM을 탐색하는 기업과 연구자에게 주목할 만한 선택지다. GPT-5.5 수준 이상의 코딩 성능을 6분의 1 비용으로 제공하며, 가중치를 직접 운용할 수 있다는 점이 핵심 강점이다. 대규모 GPU 인프라가 없는 개인 개발자에게는 API 접근이 현실적인 방법이다.

장점

  • SWE-bench Pro 62.1점으로 GPT-5.5(58.6점) 초과
  • 장기 자율 코딩 벤치마크 3종 오픈소스 전 부문 1위
  • GPT-5.5 대비 약 1/6의 낮은 비용
  • Hugging Face 즉시 다운로드 가능한 오픈웨이트 공개
  • 파인튜닝 및 자체 인프라 배포 지원

단점/한계

  • 753B 파라미터로 로컬 실행 시 대규모 GPU 클러스터 필요
  • 멀티모달 능력 및 코딩 외 일반 추론 부문 상세 비교 데이터 제한적
  • 중국 기반 공급업체로 일부 기업의 규정 준수 검토 필요

댓글0

주요 기능/특징

1. SWE-bench Pro 62.1점 달성 (GPT-5.5의 58.6점 초과) 2. FrontierSWE, PostTrainBench, SWE-Marathon 세 벤치마크 오픈소스 1위 3. 753B 파라미터 오픈웨이트 공개 (Hugging Face 즉시 다운로드) 4. GPT-5.5 대비 약 1/6 수준의 API 비용 5. 장기 자율 코딩에 특화된 설계

핵심 인사이트

  • 오픈웨이트 모델이 SWE-bench Pro에서 GPT-5.5를 초과한 것은 오픈소스 LLM 성능 진화의 중요한 사례다
  • 753B 파라미터의 오픈웨이트 공개로 코딩 에이전트 분야에서 비용 경쟁이 심화될 것으로 보인다
  • GPT-5.5 대비 1/6 비용은 대규모 코딩 자동화 파이프라인을 구축하는 기업에게 실질적 경쟁력이다
  • FrontierSWE, PostTrainBench, SWE-Marathon 세 부문 동시 오픈소스 1위는 코딩 특화 최적화가 집중적으로 이루어진 결과다
  • Simon Willison의 '현재 가장 강력한 텍스트 전용 오픈웨이트 LLM' 평가는 모델의 범용 텍스트 처리 능력도 높은 수준임을 시사한다
  • 오픈웨이트 방식은 연구 기관과 기업이 모델을 직접 파인튜닝하고 내부 데이터로 커스터마이즈할 수 있는 유연성을 제공한다
  • Z.ai의 이번 공개는 중국 AI 연구 기관이 글로벌 오픈소스 LLM 경쟁에서 기술적 우위를 점할 수 있음을 보여준다

이 리뷰가 유용했나요?

공유하기