앤스로픽(Anthropic)이 자동화된 작업 수행 능력을 갖춘 중급 언어 모델인 「클로드 소넷 5(Claude Sonnet 5)」를 공개했다. 이번 출시는 생성형 AI 분야에서 자동 에이전트 기능이 기본 요구사항으로 자리잡았음을 보여주는 동시에, 향후 경쟁의 초점이 기술 수준보다는 가격과 안정성으로 이동하고 있음을 시사한다.
앤스로픽은 블로그를 통해 「소넷 5는 브라우저와 터미널 같은 도구를 활용해 계획을 수립하고 자율적으로 작업을 수행할 수 있으며, 단 몇 개월 전까지는 더 크고 비싼 모델이 필요했던 수준의 능력을 갖췄다」고 설명했다. 화요일부터 소넷 5는 무료 및 프로 플랜의 기본 모델로 지정되며 모든 구독 플랜에서 이용할 수 있다.
가격 경쟁력은 소넷 5의 주요 강점이다. 8월 31일까지 입력 토큰 100만 개당 2달러, 출력 토큰 100만 개당 10달러로 책정되어 있으며, 이후 입력 3달러, 출력 15달러로 인상된다. 이는 상위 모델인 오푸스 4.8과 오픈에이(OpenAI)의 지피티-5.5, 구글(Google)의 제미니 3.1 프로보다 저렴하다.
성능 측면에서 소넷 5는 전작 소넷 4.6(2월 출시)과 비교해 추론, 도구 활용, 소프트웨어 코딩, 지식 업무 등에서 상당한 개선을 이뤘다. 에이전트 코딩 벤치마크에서는 63.2%의 점수를 기록했으며, 지식 업무 벤치마크에서는 오푸스 4.8을 약간 상회하는 성능을 보였다. 또한 소넷 5는 명시적 지시 없이 자신의 출력을 검증하고, 이전 버전에서는 중단되던 복잡한 다단계 작업을 끝까지 완수하는 능력을 입증했다.
보안 측면에서도 소넷 5는 악용 협력, 기만, 할루시네이션 등의 바람직하지 않은 행동이 전작보다 적으며, 악의적 요청 거부와 프롬프트 주입 공격 회피에 더 능숙하다. 다만 오푸스 4.8과 클로드 미토스 프리뷰(Claude Mythos Preview) 수준의 안전성에는 미치지 못하는 것으로 평가됐다.