🚀 Claude Sonnet 5 출시 — Opus급 에이전트 성능을 Sonnet 가격에

에이전트 시대의 새로운 기준, Claude Sonnet 5

Anthropic이 2026년 6월 30일 Claude Sonnet 5를 공식 출시했습니다. 이번 모델은 단순한 성능 업그레이드를 넘어, 에이전트 (agent) 워크플로우에 특화된 설계를 전면에 내세운 것이 가장 큰 특징입니다. 브라우저와 터미널 같은 도구 (tool)를 자율적으로 사용하고, 복잡한 멀티스텝 작업을 스스로 완수하는 능력에서 이전 Sonnet 계열 모델들과 확연히 다른 수준을 보여줍니다.

Sonnet이 Opus를 따라잡다

Anthropic의 모델 라인업에서 에이전트 역량의 선두 주자는 그동안 Opus 계열이었습니다. Claude Sonnet 3.5, 3.6, 3.7이 코딩과 도구 사용에서 인상적인 성과를 보여줬지만, 실질적인 에이전트 성능의 도약은 더 크고 비싼 Opus 모델에서 이루어져 왔습니다. Sonnet 5는 이 격차를 좁히는 것을 핵심 목표로 개발되었습니다.

Anthropic의 평가에 따르면, Sonnet 5의 에이전트 성능은 Opus 4.8에 근접하면서도 더 낮은 가격에 제공됩니다. 추론 (reasoning), 도구 사용 (tool use), 코딩, 지식 업무 등 에이전트 성능의 핵심 지표에서 전작인 Sonnet 4.6 대비 뚜렷한 향상을 보였습니다. 특히 에이전트 검색 평가인 BrowseComp와 컴퓨터 사용 (computer use) 평가인 OSWorld-Verified에서, 노력 수준 (effort level)을 높일수록 일부 작업에서는 Opus 4.8과 동등한 성과를 냈습니다.

실제 현장에서 확인된 변화

얼리 액세스 파트너들의 피드백은 한 방향을 가리킵니다. "이전 Sonnet 모델이 중간에 멈추던 복잡한 작업을 Sonnet 5는 끝까지 완수한다"는 것입니다. 구체적인 사례들이 인상적입니다.

Salesforce 계정 등급 업데이트와 런칭 공지 이메일 발송을 하나의 지시로 처음부터 끝까지 완료 — 이전에는 중간에 멈추던 작업
버그 수정 요청을 받은 Sonnet 5가 별도 지시 없이 재현 테스트를 작성하고, 수정을 구현한 뒤, 수정 전 상태로 되돌려 버그가 다시 나타나는지 검증하는 과정을 단일 패스 (single pass)로 처리
수십 개의 실제 풀 리퀘스트 (pull request)를 각각 테스트 및 검증된 결과물까지 자율적으로 완수
보험 업무용 컴퓨터 사용 에이전트에서 접수, FNOL, 손실 이력 등 실무 워크플로우를 정확하고 빠르게 처리

Lovable, ClickHouse, Cursor 등 AI 개발 생태계의 주요 플레이어들이 파트너로 참여해 실제 프로덕션 환경에서의 유효성을 검증했습니다.

안전성 평가: 더 안전해진 에이전트

성능 향상과 함께 안전성 (safety) 평가 결과도 주목할 만합니다. Anthropic의 사전 배포 평가에서 Sonnet 5는 전반적으로 Sonnet 4.6보다 낮은 비율의 비정렬 (misaligned) 행동을 보였습니다. 특히 에이전트 컨텍스트에서 악의적 요청 거부와 프롬프트 인젝션 (prompt injection) 공격 저항력이 향상되었고, 환각 (hallucination)과 아첨 (sycophancy) 비율도 낮아졌습니다.

사이버보안 역량 측면에서는 의도적으로 관련 훈련을 하지 않았으며, 평가 결과 Opus 4.8이나 Mythos 5 대비 현저히 낮은 사이버 공격 능력을 보였습니다. Firefox 취약점 익스플로잇 (exploit) 개발 평가에서 Sonnet 5는 완전한 익스플로잇 개발에 성공한 사례가 0%였습니다. 다만 Sonnet 4.6보다 부분적 성공률이 소폭 높아진 점을 감안해, 출시 시점부터 사이버 보안 세이프가드 (safeguard)를 기본 활성화 상태로 제공합니다.

가격 및 제공 방식

Claude Sonnet 5는 오늘부터 모든 플랜에서 사용할 수 있습니다. Free 및 Pro 플랜의 기본 모델로 설정되었으며, Max, Team, Enterprise 사용자에게도 제공됩니다. Claude Code와 Claude Platform에서도 즉시 사용 가능합니다.

API 가격은 다음과 같습니다.

도입 가격 (2026년 8월 31일까지): 입력 $2 / 백만 토큰, 출력 $10 / 백만 토큰
정식 가격 (2026년 9월 1일 이후): 입력 $3 / 백만 토큰, 출력 $15 / 백만 토큰

비교 기준인 Opus 4.8은 입력 $5 / 백만 토큰, 출력 $25 / 백만 토큰으로, Sonnet 5는 도입 가격 기준으로 Opus 4.8 대비 절반 이하의 비용으로 근접한 성능을 제공합니다. API에서는 claude-sonnet-5 식별자로 호출할 수 있습니다.

바이브코더에게 의미하는 것

Claude Sonnet 5는 에이전트 기반 개발 워크플로우를 구축하는 바이브코더 (vibe coder)와 AI 개발자들에게 실질적인 선택지를 넓혀줍니다. 지금까지 Opus급 자율성이 필요한 작업은 높은 비용을 감수해야 했지만, 이제 Sonnet 가격대에서 그에 준하는 에이전트 성능을 기대할 수 있게 되었습니다. 특히 코드 리뷰, 버그 수정, 멀티스텝 자동화처럼 "끝까지 완수"가 중요한 작업에서 Sonnet 5의 개선이 두드러지는 만큼, 에이전트 파이프라인 비용 최적화를 고민하는 팀이라면 적극적으로 검토해볼 시점입니다.

📎 출처: Anthropic 뉴스룸