Anthropic Advisor Strategy: Opus 지능을 Sonnet 비용으로 구현
Anthropic이 Claude Opus 4.6을 어드바이저로, Sonnet이나 Haiku를 실행자로 조합하는 'Advisor Strategy'를 공개했다. SWE-bench 점수 2.7%p 향상과 함께 비용은 11.9% 절감되는 효과가 확인됐다.
Anthropic이 Claude Opus 4.6을 어드바이저로, Sonnet이나 Haiku를 실행자로 조합하는 'Advisor Strategy'를 공개했다. SWE-bench 점수 2.7%p 향상과 함께 비용은 11.9% 절감되는 효과가 확인됐다.
핵심 요약
Anthropicが 2026년 4월 9일, AI 에이전트 비용과 성능 두 가지를 동시에 잡는 새로운 API 기능 'Advisor Strategy'를 공개했다. Claude Opus 4.6을 어드바이저 모델로, 더 저렴한 Sonnet 또는 Haiku를 실행자(executor)로 조합하는 방식으로, 기업들의 에이전트 AI 구축 비용을 대폭 낮추면서도 Opus급 성능을 유지할 수 있게 했다.
Advisor Strategy 작동 원리
이 전략의 핵심은 역할 분리다. 실행자(executor) 모델인 Sonnet 또는 Haiku가 작업을 처음부터 끝까지 처리한다. 도구를 호출하고, 결과를 분석하며, 반복적으로 해결책을 찾아간다. 그러다 어려운 판단이 필요한 지점에 도달하면, 실행자가 Opus 어드바이저에게 조언을 구한다.
Opus는 공유된 컨텍스트를 검토한 후 계획, 수정 사항, 또는 중단 신호를 반환한다. 이후 실행자가 다시 작업을 이어받아 진행한다. 이 모든 과정은 단일 /v1/messages API 호출 안에서 이루어지므로 추가 왕복 통신이 필요 없다.
성능 데이터
Anthropicが 공개한 벤치마크 결과는 인상적이다.
Sonnet + Opus 어드바이저 조합:
- SWE-bench Multilingual에서 Sonnet 단독 대비 2.7%p 향상
- 에이전트 작업당 비용 11.9% 절감
Haiku + Opus 어드바이저 조합:
- BrowseComp 벤치마크에서 41.2% 달성 (Haiku 단독 19.7% 대비 2배 이상)
- Sonnet 단독보다는 29% 낮은 점수지만, 비용은 85% 저렴
비용 구조를 살펴보면, 어드바이저 토큰은 Opus 요금으로, 실행자 토큰은 Sonnet/Haiku 요금으로 청구된다. 어드바이저는 일반적으로 400~700 토큰만 생성하는 반면, 실행자가 전체 출력을 담당하므로 전체 비용은 Opus를 단독으로 사용하는 것보다 훨씬 낮게 유지된다.
API 구현 방법
개발자들은 Messages API 요청에 advisor_20260301 베타 헤더를 선언하는 것만으로 이 기능을 활성화할 수 있다.
anthropic-beta: advisor-tool-2026-03-01
max_uses 파라미터로 요청당 어드바이저 호출 횟수를 제한할 수 있으며, 어드바이저 토큰 사용량은 별도로 리포팅되어 비용 추적이 용이하다.
활용 사례
Advisor Strategy는 특히 복잡한 코딩 에이전트, 장시간 실행되는 자동화 워크플로우, 멀티스텝 리서치 에이전트 등에 적합하다. 대부분의 작업을 저렴한 모델이 처리하되, 핵심적인 판단이 필요한 순간만 고성능 모델의 지식을 빌리는 방식이다.
실제로 코딩 에이전트를 운영하는 기업 입장에서는, 전체 작업을 Opus로 돌리는 것보다 비용은 낮추면서도 Sonnet 단독보다 높은 품질을 얻을 수 있어 현실적인 배포 전략으로 주목받고 있다.
장단점 분석
장점:
- 비용 대비 성능 최적화: Opus급 지능을 Sonnet 수준 비용으로 활용
- 구현 단순성: 단일 API 호출로 처리되어 아키텍처 복잡도 낮음
- 유연한 조합: Sonnet + Opus 또는 Haiku + Opus 등 요구사항에 맞게 선택 가능
- 비용 투명성: 어드바이저 토큰 별도 리포팅으로 정확한 비용 파악 가능
단점/한계:
- 현재 베타 단계: 프로덕션 안정성 검증 필요
- 어드바이저 호출 지점 설계가 중요: 어디서 Opus에게 물을지 에이전트 설계에 따라 효과 차이 큼
- 최고 난이도 작업에서는 Opus 단독만큼의 성능 미보장
전망
Advisor Strategy는 AI 에이전트 비용 문제를 해결하는 실용적인 접근법으로 평가된다. 프론티어 모델을 전면 배포하는 비용 부담 없이도 고성능을 얻을 수 있다는 점에서, 기업들이 AI 에이전트를 본격적으로 프로덕션에 올리는 데 허들을 낮춰줄 것으로 보인다.
특히 OpenAI가 Codex 에이전트 플랫폼 강화에 집중하고 있는 상황에서, Anthropic이 비용 효율성이라는 무기로 개발자 커뮤니티를 공략하는 전략으로 읽힌다.
결론
Advisor Strategy는 AI 에이전트 구축 비용과 성능 사이의 트레이드오프를 줄이는 실질적인 혁신이다. SWE-bench 성능 향상과 비용 절감이 동시에 확인된 만큼, 에이전트 AI를 프로덕션에서 운영 중인 개발팀이라면 즉시 도입을 검토해볼 가치가 있다.
장점
- 검증된 성능 향상: SWE-bench 2.7%p 향상이 공식 수치로 확인됨
- 즉각적인 비용 절감: Sonnet+Opus 조합 11.9%, Haiku+Opus 조합 85% 비용 절감
- 구현 단순성: 기존 API 호출에 헤더 하나 추가만으로 적용 가능
- 유연한 조합 선택: 성능/비용 요구사항에 따라 Sonnet 또는 Haiku 선택 가능
단점/한계
- 베타 단계로 프로덕션 안정성 검증이 아직 진행 중
- 어드바이저 호출 시점 설계에 따라 효과가 달라지므로 에이전트 설계 노하우 필요
- 최고 난이도 작업(Opus 단독 필요 수준)에서는 성능 차이 발생 가능
참고 자료
댓글0개
주요 기능/특징
1. 역할 분리 아키텍처: Opus는 어드바이저, Sonnet/Haiku는 실행자로 역할을 나눠 비용 최적화 2. 성능 향상: Sonnet+Opus 조합으로 SWE-bench Multilingual 2.7%p 향상, 비용 11.9% 절감 3. 단일 API 호출: advisor_20260301 베타 헤더 하나로 활성화, 추가 아키텍처 불필요 4. 극단적 비용 절감: Haiku+Opus 조합은 BrowseComp 41.2% 달성하면서 Sonnet 단독보다 85% 저렴 5. 세밀한 제어: max_uses 파라미터로 어드바이저 호출 횟수 조절 가능
핵심 인사이트
- 에이전트 AI의 핵심 과제인 '비용 vs 성능' 트레이드오프를 역할 분리 아키텍처로 해결한 실용적 접근이다
- Opus가 400~700 토큰만 생성해도 전체 에이전트 성능이 향상된다는 점은 LLM의 '지식 전이' 효율이 매우 높음을 시사한다
- 85% 비용 절감(Haiku+Opus)이라는 수치는 스타트업과 중소기업이 엔터프라이즈급 AI 에이전트를 구축하는 장벽을 크게 낮춘다
- Anthropic이 단순한 성능 경쟁보다 비용 효율성으로 개발자 시장을 공략하는 전략적 방향성이 보인다
- 코딩 에이전트(SWE-bench), 웹 브라우징(BrowseComp) 두 분야 모두에서 효과가 검증됐다는 점이 범용성을 높인다
- 단일 API 호출 방식은 기존 에이전트 코드를 대규모로 수정하지 않고도 도입할 수 있어 채택 장벽이 낮다
- 어드바이저 토큰 별도 리포팅은 비용 최적화를 위한 데이터 기반 의사결정을 가능하게 한다
이 리뷰가 유용했나요?
공유하기
관련 AI 리뷰
Anthropic 연매출 $30B 돌파: Google·Broadcom과 3.5GW TPU 공급 계약 체결
Anthropic이 연간 실행 매출 300억 달러를 달성하며 Google, Broadcom과 2027년부터 공급될 3.5GW 규모의 차세대 TPU 컴퓨팅 계약을 체결했다. AI 인프라 역사상 최대 규모의 민간 컴퓨팅 조달 계약으로 평가받는다.
Claude Mythos Preview: 93.9% SWE-bench, 공개 포기의 이유
Anthropic이 4월 7일 Claude Mythos Preview를 발표했다. SWE-bench 93.9% 역대 최강 모델이나 제로데이 취약점 자동 발견 능력 때문에 일반 공개를 포기하고 Project Glasswing을 출범했다.
Anthropic, Claude 구독에서 OpenClaw 등 서드파티 도구 지원 중단
Anthropic이 4월 4일부터 Claude 구독으로 OpenClaw 등 서드파티 에이전트 도구를 사용할 수 없도록 제한했다. 인프라 부담을 이유로 들었지만, 개발자 커뮤니티의 반발이 거세다.
Claude Code 소스코드 전체 유출: npm 패키징 실수로 51만 줄 노출
Anthropic의 핵심 수익원 Claude Code의 전체 소스코드가 npm 소스맵 파일을 통해 유출됐다. 약 1,900개 TypeScript 파일, 51만 줄의 코드가 노출되며 AI 개발 도구의 내부 구조가 공개됐다.
