GPT-5.4 출시: 컴퓨터 자율 조작과 100만 토큰 컨텍스트의 등장
OpenAI가 2026년 3월 5일 GPT-5.4를 출시했다. 범용 모델 최초로 네이티브 컴퓨터 사용 기능을 탑재하고, OSWorld 벤치마크에서 인간 수준(75%)을 달성했다. 100만 토큰 컨텍스트 윈도우와 Tool Search 시스템도 함께 공개됐다.
OpenAI가 2026년 3월 5일 GPT-5.4를 출시했다. 범용 모델 최초로 네이티브 컴퓨터 사용 기능을 탑재하고, OSWorld 벤치마크에서 인간 수준(75%)을 달성했다. 100만 토큰 컨텍스트 윈도우와 Tool Search 시스템도 함께 공개됐다.
OpenAI의 가장 강력한 프론티어 모델
OpenAI는 2026년 3월 5일 GPT-5.4를 공식 출시했다. OpenAI는 이를 "전문 업무를 위한 가장 능력 있고 효율적인 프론티어 모델"이라고 소개했다. GPT-5.3 Instant 출시 불과 이틀 만의 발표로, OpenAI의 모델 출시 주기가 극단적으로 빨라지고 있음을 보여준다.
GPT-5.4는 Thinking(추론 강화), Pro(고성능), 표준 버전 세 가지 변종으로 제공된다. ChatGPT, Codex, API에서 순차적으로 배포 중이다.
핵심 기능 1: 네이티브 컴퓨터 사용
GPT-5.4의 가장 주목할 기능은 네이티브 컴퓨터 사용(Computer Use) 능력이다. 이전까지 컴퓨터 조작 기능은 Anthropic Claude의 전유물이었으나, GPT-5.4는 범용 모델로서는 최초로 이 기능을 탑재했다.
스크린샷을 보고 키보드와 마우스 동작을 자율적으로 수행하며, 여러 애플리케이션을 넘나들며 복잡한 다단계 작업을 처리할 수 있다. 개발자가 별도의 인프라를 구축할 필요 없이, 모델 자체가 소프트웨어를 자율적으로 조작한다.
| 벤치마크 | GPT-5.2 | GPT-5.4 | 인간 수준 |
|---|---|---|---|
| OSWorld-Verified | 47.3% | 75.0% | 72.4% |
| WebArena Verified | - | 기록적 성과 | - |
| GDPval (지식 업무) | 71.0% | 83.0% | 비교 기준 |
OSWorld-Verified에서 75.0%를 달성하여 인간 수준(72.4%)을 처음으로 넘어섰다. 이는 데스크톱 환경 탐색 능력이 실제 사용자 수준에 도달했음을 의미한다.
핵심 기능 2: 100만 토큰 컨텍스트 윈도우
API 버전 GPT-5.4는 최대 100만 토큰의 컨텍스트 윈도우를 지원한다. OpenAI 모델 중 역대 최대 규모다. 이전 GPT-5.3의 40만 토큰에서 2.5배 확장됐다.
다만 API 가격 구조에 주의가 필요하다. 프롬프트가 272K 토큰을 초과하면 입력 토큰 단가가 100만 토큰당 $2.50에서 $5.00으로 두 배가 된다.
핵심 기능 3: Tool Search 시스템
GPT-5.4와 함께 공개된 Tool Search는 API의 도구 호출 방식을 근본적으로 바꾼다. 기존에는 개발자가 사용 가능한 도구를 사전에 정의해야 했지만, Tool Search를 통해 모델이 필요한 외부 도구를 자동으로 탐색하고 호출할 수 있다.
이는 에이전틱 AI의 핵심 기능으로, 사전 통합 없이도 다양한 외부 서비스와 연동할 수 있는 가능성을 열었다.
토큰 효율성과 가격
GPT-5.4는 같은 문제를 해결하는 데 이전 모델보다 최대 47% 적은 토큰을 사용한다. 토큰당 단가는 소폭 인상되었지만, 효율성 개선으로 실질 비용은 상쇄될 수 있다.
| 항목 | GPT-5.2 | GPT-5.4 |
|---|---|---|
| 입력 (100만 토큰) | $1.75 | $2.50 |
| 출력 (100만 토큰) | $14.00 | $15.00 |
| 토큰 효율성 | 기준 | 47% 개선 |
엔터프라이즈 통합
OpenAI는 GPT-5.4와 함께 ChatGPT for Excel과 Google Sheets 통합을 발표했다. FactSet, MSCI, Third Bridge, Moody's 등 금융 데이터 제공업체와의 연동도 추가됐다. 이는 ChatGPT를 단순 대화 도구에서 업무 플랫폼으로 전환하려는 전략의 일환이다.
투자은행 분석가 수준의 스프레드시트 모델링 작업에서 GPT-5.4는 87.3%의 평균 점수를 기록했다. GPT-5.2의 68.4%에서 크게 향상된 수치다.
환각 감소
GPT-5.2 대비 개별 주장의 오류 가능성이 33% 감소했고, 전체 응답에 오류가 포함될 확률은 18% 줄었다. GPT-5.3 Instant에 이어 환각 감소 추세가 지속되고 있다.
결론: Anthropic과의 정면 승부
GPT-5.4는 컴퓨터 사용 기능으로 Anthropic의 핵심 차별점을 정면으로 겨냥했다. 동시에 100만 토큰 컨텍스트와 엔터프라이즈 통합으로 Google Gemini와도 경쟁한다. 주 단위로 새 모델을 출시하는 OpenAI의 공격적 전략이 시장 판도를 어떻게 바꿀지 주목된다.
장점
- 범용 모델 최초 네이티브 컴퓨터 사용 기능으로 OSWorld에서 인간 수준 돌파(75.0%)
- 100만 토큰 컨텍스트 윈도우로 대규모 문서와 코드베이스 분석 가능
- 토큰 효율성 47% 개선으로 실질 비용 절감 가능
- Tool Search로 외부 도구 자동 탐색 및 호출 지원
- Excel/Google Sheets 통합으로 엔터프라이즈 생산성 도구로 진화
단점/한계
- 272K 토큰 초과 시 입력 단가가 두 배로 증가하여 대규모 컨텍스트 활용 시 비용 부담
- GPT-5.4 Pro는 Enterprise/Edu 구독자만 접근 가능하여 일반 사용자 접근이 제한적
- 컴퓨터 사용 기능의 보안 위험과 자율 조작 범위에 대한 명확한 가이드라인이 부족
- 주 단위 모델 출시로 기업 사용자의 버전 관리와 마이그레이션 부담 증가
참고 자료
댓글0개
주요 기능/특징
OpenAI가 2026년 3월 5일 GPT-5.4를 출시했다. 범용 모델 최초로 네이티브 컴퓨터 사용 기능을 탑재하여 OSWorld 벤치마크에서 75.0%로 인간 수준(72.4%)을 돌파했다. 100만 토큰 컨텍스트 윈도우는 OpenAI 역대 최대 규모이며, Tool Search 시스템으로 외부 도구 자동 탐색이 가능해졌다. ChatGPT for Excel/Google Sheets 통합과 금융 데이터 연동도 함께 공개됐다.
핵심 인사이트
- OSWorld-Verified 75.0% 달성으로 AI가 데스크톱 환경 조작에서 인간 수준을 처음으로 넘어섰다.
- GPT-5.3 출시 이틀 만에 GPT-5.4를 내놓은 것은 AI 모델 출시 주기가 주 단위로 단축되고 있음을 보여준다.
- 네이티브 컴퓨터 사용 기능은 Anthropic Claude의 핵심 차별점을 정면으로 겨냥한 전략적 선택이다.
- Tool Search 시스템은 에이전틱 AI의 실질적 구현으로, 사전 통합 없는 외부 서비스 연동을 가능케 한다.
- 100만 토큰 컨텍스트 윈도우는 장문서 분석과 대규모 코드베이스 처리에 획기적인 변화를 가져올 수 있다.
- 토큰 효율성 47% 개선은 단가 인상을 상쇄하고 실질 비용을 낮출 수 있는 핵심 요소다.
- 엔터프라이즈 금융 도구 통합은 ChatGPT를 업무 플랫폼으로 전환하려는 OpenAI의 수익화 전략을 반영한다.
- 환각률 지속 감소(GPT-5.3에 이어 5.4에서도 개선)는 AI 신뢰성이 체계적으로 개선되고 있음을 시사한다.
이 리뷰가 유용했나요?
공유하기
관련 AI 리뷰
ChatGPT 개인 금융 대시보드 출시: 은행 계좌 직접 연동, Pro 전용
OpenAI가 2026년 5월 15일 ChatGPT Pro 사용자를 위한 개인 금융 대시보드를 출시했다. Plaid를 통해 1만 2천 개 이상의 금융기관과 연동되며, 지출 분석·자산 현황·예산 조언 기능을 AI로 제공한다.
OpenAI AI 에이전트 폰 2027 출시 가속화: 앱을 대체하는 AI 폰의 실체
OpenAI가 2027년 상반기 양산을 목표로 AI 에이전트 기반 스마트폰 개발을 가속화하고 있다. MediaTek Dimensity 9600 커스텀 칩과 Luxshare 제조 파트너십으로 기존 앱 생태계를 AI 에이전트로 대체하는 새로운 기기를 준비 중이다.
OpenAI, 음성 AI 3종 동시 출시: GPT-Realtime-2·번역·받아쓰기
OpenAI가 5월 7일 실시간 음성 API용 모델 3종을 공개했다. GPT-5급 추론의 GPT-Realtime-2, 70개 언어 번역, 스트리밍 받아쓰기 모델이 동시 출시됐다.
GPT-5.5 Instant, ChatGPT 기본 모델 교체: 환각 52.5% 감소·Gmail 연동 개인화
OpenAI가 2026년 5월 5일 GPT-5.5 Instant를 ChatGPT의 새 기본 모델로 출시했다. 기존 GPT-5.3 Instant 대비 환각을 52.5% 줄이고 Gmail·과거 대화를 활용한 맞춤형 답변 기능을 추가했다.
