Anthropic이 2026년 6월 30일 Claude Sonnet 5를 공식 출시했습니다. 이번 모델은 단순한 성능 업그레이드를 넘어, 에이전트 (agent) 워크플로우에 특화된 설계를 전면에 내세운 것이 가장 큰 특징입니다. 브라우저와 터미널 같은 도구 (tool)를 자율적으로 사용하고, 복잡한 멀티스텝 작업을 스스로 완수하는 능력에서 이전 Sonnet 계열 모델들과 확연히 다른 수준을 보여줍니다.
Anthropic의 모델 라인업에서 에이전트 역량의 선두 주자는 그동안 Opus 계열이었습니다. Claude Sonnet 3.5, 3.6, 3.7이 코딩과 도구 사용에서 인상적인 성과를 보여줬지만, 실질적인 에이전트 성능의 도약은 더 크고 비싼 Opus 모델에서 이루어져 왔습니다. Sonnet 5는 이 격차를 좁히는 것을 핵심 목표로 개발되었습니다.
Anthropic의 평가에 따르면, Sonnet 5의 에이전트 성능은 Opus 4.8에 근접하면서도 더 낮은 가격에 제공됩니다. 추론 (reasoning), 도구 사용 (tool use), 코딩, 지식 업무 등 에이전트 성능의 핵심 지표에서 전작인 Sonnet 4.6 대비 뚜렷한 향상을 보였습니다. 특히 에이전트 검색 평가인 BrowseComp와 컴퓨터 사용 (computer use) 평가인 OSWorld-Verified에서, 노력 수준 (effort level)을 높일수록 일부 작업에서는 Opus 4.8과 동등한 성과를 냈습니다.
얼리 액세스 파트너들의 피드백은 한 방향을 가리킵니다. "이전 Sonnet 모델이 중간에 멈추던 복잡한 작업을 Sonnet 5는 끝까지 완수한다"는 것입니다. 구체적인 사례들이 인상적입니다.
Lovable, ClickHouse, Cursor 등 AI 개발 생태계의 주요 플레이어들이 파트너로 참여해 실제 프로덕션 환경에서의 유효성을 검증했습니다.
성능 향상과 함께 안전성 (safety) 평가 결과도 주목할 만합니다. Anthropic의 사전 배포 평가에서 Sonnet 5는 전반적으로 Sonnet 4.6보다 낮은 비율의 비정렬 (misaligned) 행동을 보였습니다. 특히 에이전트 컨텍스트에서 악의적 요청 거부와 프롬프트 인젝션 (prompt injection) 공격 저항력이 향상되었고, 환각 (hallucination)과 아첨 (sycophancy) 비율도 낮아졌습니다.
사이버보안 역량 측면에서는 의도적으로 관련 훈련을 하지 않았으며, 평가 결과 Opus 4.8이나 Mythos 5 대비 현저히 낮은 사이버 공격 능력을 보였습니다. Firefox 취약점 익스플로잇 (exploit) 개발 평가에서 Sonnet 5는 완전한 익스플로잇 개발에 성공한 사례가 0%였습니다. 다만 Sonnet 4.6보다 부분적 성공률이 소폭 높아진 점을 감안해, 출시 시점부터 사이버 보안 세이프가드 (safeguard)를 기본 활성화 상태로 제공합니다.
Claude Sonnet 5는 오늘부터 모든 플랜에서 사용할 수 있습니다. Free 및 Pro 플랜의 기본 모델로 설정되었으며, Max, Team, Enterprise 사용자에게도 제공됩니다. Claude Code와 Claude Platform에서도 즉시 사용 가능합니다.
API 가격은 다음과 같습니다.
비교 기준인 Opus 4.8은 입력 $5 / 백만 토큰, 출력 $25 / 백만 토큰으로, Sonnet 5는 도입 가격 기준으로 Opus 4.8 대비 절반 이하의 비용으로 근접한 성능을 제공합니다. API에서는 claude-sonnet-5 식별자로 호출할 수 있습니다.
Claude Sonnet 5는 에이전트 기반 개발 워크플로우를 구축하는 바이브코더 (vibe coder)와 AI 개발자들에게 실질적인 선택지를 넓혀줍니다. 지금까지 Opus급 자율성이 필요한 작업은 높은 비용을 감수해야 했지만, 이제 Sonnet 가격대에서 그에 준하는 에이전트 성능을 기대할 수 있게 되었습니다. 특히 코드 리뷰, 버그 수정, 멀티스텝 자동화처럼 "끝까지 완수"가 중요한 작업에서 Sonnet 5의 개선이 두드러지는 만큼, 에이전트 파이프라인 비용 최적화를 고민하는 팀이라면 적극적으로 검토해볼 시점입니다.
📎 출처: Anthropic 뉴스룸
아직 댓글이 없습니다