2026.02.18
3.7천
0
0
Claude

Claude Sonnet 4.6 출시: Opus급 성능을 1/5 가격에 제공하는 새로운 기본 모델

Anthropic이 Claude Sonnet 4.6을 공식 출시했다. SWE-bench 79.6%, OSWorld 72.5%로 Opus급 성능을 달성하면서도 가격은 그대로 유지해 가성비의 새 기준을 세웠다.

#Claude#Sonnet 4.6#Anthropic#LLM#벤치마크
Claude Sonnet 4.6 출시: Opus급 성능을 1/5 가격에 제공하는 새로운 기본 모델
AI 핵심 요약

Anthropic이 Claude Sonnet 4.6을 공식 출시했다. SWE-bench 79.6%, OSWorld 72.5%로 Opus급 성능을 달성하면서도 가격은 그대로 유지해 가성비의 새 기준을 세웠다.

Anthropic, Sonnet 4.6을 새로운 기본 모델로 발표

Anthropicが 2026년 2월 17일 Claude Sonnet 4.6을 공식 출시했다. 이번 모델은 무료 및 Pro 사용자 모두의 기본 모델로 설정되며, 코딩, 컴퓨터 사용, 장문맥 추론, 에이전트 계획, 지식 업무, 디자인 등 전 영역에서 대폭 업그레이드되었다.

가장 주목할 점은 가격이다. Sonnet 4.6은 입력 토큰 100만 개당 $3, 출력 토큰 100만 개당 $15로 기존 Sonnet 4.5와 동일한 가격을 유지한다. Opus 모델의 $15/$75 대비 정확히 1/5 수준이면서, 대부분의 실무 작업에서 Opus에 근접하는 성능을 보여준다.

핵심 벤치마크 성적

Sonnet 4.6의 벤치마크 점수는 Opus 모델과의 격차를 극적으로 좁혔다.

벤치마크Sonnet 4.6Opus 4.6비고
SWE-bench Verified79.6%80.8%격차 1.2%p
OSWorld72.5%-16개월간 14.9%에서 5배 향상
보험 벤치마크94%-인간 수준 정확도

SWE-bench Verified에서 79.6%를 기록해 Opus 4.6의 80.8%와 불과 1.2%p 차이를 보였다. OSWorld에서는 72.5%를 달성했는데, 이는 2024년 10월 컴퓨터 사용 기능이 처음 출시됐을 때의 14.9%에서 16개월 만에 거의 5배 향상된 수치다.

1M 토큰 컨텍스트 윈도우

Sonnet 4.6은 100만 토큰 컨텍스트 윈도우를 베타로 지원한다. 이를 통해 긴 문서 분석, 전체 코드베이스 인제스션, 확장된 에이전트 워크플로우가 가능해졌다. 기존에는 커스텀 청킹 파이프라인이 필요했던 작업들을 하나의 프롬프트로 처리할 수 있다.

또한 컨텍스트 압축 기능이 베타로 추가되어, 대화가 진행되면서 자동으로 이전 내용을 요약해 유효 컨텍스트를 연장한다.

사용자 선호도 압도적 우위

Claude Code에서 조기 테스트한 사용자들은 Sonnet 4.6을 Sonnet 4.5보다 약 70% 더 선호했다. 더 놀라운 점은 이전 세대 플래그십 모델인 Opus 4.5 대비에서도 59%의 선호도를 보였다는 것이다. 사용자들은 "더 나은 문맥 이해, 코드 중복 감소, 과도한 엔지니어링 감소"를 주요 장점으로 꼽았다.

Adaptive Thinking과 새로운 도구

Sonnet 4.6은 adaptive thinking과 extended thinking을 지원한다. 웹 검색 및 페치 도구가 동적 필터링으로 개선되어 토큰 효율성이 높아졌으며, 코드 실행, 메모리, 도구 검색 기능이 일반 공개(GA)로 전환되었다.

Opus 대비 포지셔닝

Anthropicは 코드베이스 리팩토링, 다중 에이전트 워크플로우 조율, 최고의 정확도가 필요한 작업에서는 여전히 Opus 4.6이 강점을 가진다고 밝혔다. 하지만 대부분의 실무 작업에서 Sonnet 4.6이 비용 효율적인 대안이 될 수 있음을 강조했다.

전망

Anthropicは Opus 4.6 출시 후 불과 12일 만에 Sonnet 4.6을 발표하며 빠른 모델 업데이트 속도를 과시했다. Sonnet 4.6의 출시는 AI 모델 시장에서 '성능 대비 가격' 경쟁이 본격화되고 있음을 보여준다. 기업들은 이제 Opus급 성능을 1/5 비용으로 활용할 수 있게 되면서, AI 도입의 경제적 장벽이 크게 낮아졌다.

장점

  • Opus급 성능을 1/5 가격에 제공하는 뛰어난 가성비
  • 100만 토큰 컨텍스트 윈도우로 대규모 코드베이스 분석 가능
  • OSWorld 72.5%로 컴퓨터 사용 능력 대폭 향상
  • 무료 사용자도 기본 모델로 이용 가능

단점/한계

  • 최고 정확도 작업에서는 여전히 Opus 4.6이 필요하다
  • 1M 컨텍스트 윈도우는 아직 베타 단계다
  • 다중 에이전트 오케스트레이션에서는 Opus 대비 한계가 있다

댓글0

주요 기능/특징

Claude Sonnet 4.6은 Anthropic의 최신 중급 모델로, SWE-bench Verified 79.6%, OSWorld 72.5%의 벤치마크 점수를 기록했다. 100만 토큰 컨텍스트 윈도우(베타), 컨텍스트 압축, adaptive thinking, 개선된 웹 검색 도구를 지원하며, Opus 4.6 대비 1/5 가격($3/$15 per M tokens)으로 대부분의 실무 작업에서 유사한 성능을 제공한다.

핵심 인사이트

  • SWE-bench Verified 79.6%로 Opus 4.6(80.8%)과 1.2%p 차이까지 좁혔다
  • OSWorld 72.5% 달성으로 16개월간 14.9%에서 약 5배 향상되었다
  • Claude Code 사용자의 70%가 Sonnet 4.5보다 Sonnet 4.6을 선호했다
  • Opus 4.5 대비에서도 59%의 사용자 선호도를 기록했다
  • 가격은 Sonnet 4.5와 동일한 $3/$15(100만 토큰)으로 유지했다
  • 100만 토큰 컨텍스트 윈도우를 베타로 지원한다
  • Opus 4.6 출시 후 불과 12일 만에 발표되어 빠른 업데이트 속도를 보여줬다
  • 무료 및 Pro 사용자 모두의 기본 모델로 설정되었다

이 리뷰가 유용했나요?

공유하기