Anthropic이 Claude Sonnet 5를 공개하면서 가격 프로모션을 함께 걸었습니다. 공식 발표 ↗에 따르면 Claude Sonnet 5는 2026년 8월 31일까지 입력 100만 토큰당 2달러, 출력 100만 토큰당 10달러로 제공됩니다. 이후에는 입력 3달러, 출력 15달러가 표준 가격입니다.
먼저 결론부터 말하면, 이번 할인은 단순한 출시 기념 쿠폰이라기보다 Sonnet 5를 실제 에이전트 워크로드에 넣어보라는 벤치마크 기간에 가깝습니다. 8월 31일까지 확인해야 할 것은 “답변이 좋아졌는가”가 아니라 “우리 작업을 정가 기준으로도 더 싸게 끝내는가”입니다.
이 글에서 다루는 내용:
- Sonnet 5 introductory pricing의 정확한 가격과 할인 폭
- 할인 가격만 보면 놓치기 쉬운 tokenizer와 effort 변수
- 8월 31일까지 팀에서 실제로 측정해야 할 비용 지표
- 기존 Sonnet 5 글과 다른 관점의 도입 판단 프레임
가격은 33% 낮게 시작합니다
Claude pricing 문서 ↗는 Claude Sonnet 5 가격을 두 구간으로 나눕니다. 2026년 8월 31일까지는 introductory pricing이 적용되고, 2026년 9월 1일부터 표준 가격이 적용됩니다.
| 구분 | 입력 100만 토큰 | 출력 100만 토큰 | 5분 cache write | 1시간 cache write | cache hit |
|---|---|---|---|---|---|
| 2026-08-31까지 | $2 | $10 | $2.50 | $4 | $0.20 |
| 2026-09-01부터 | $3 | $15 | $3.75 | $6 | $0.30 |
입력과 출력 모두 표준 가격 대비 약 33% 낮습니다. cache write와 cache hit 가격도 같은 비율로 낮게 시작합니다.
flowchart LR
A["2026-07~08<br/>할인 가격으로 실측"] --> B["작업별 성공률<br/>재시도 횟수 기록"]
B --> C["정가 기준으로<br/>비용 재계산"]
C --> D{"ROI 유지?"}
D -->|예| E["프로덕션 기본 모델 후보"]
D -->|아니오| F["작업 범위·effort<br/>모델 라우팅 조정"]
할인율 자체는 이해하기 쉽습니다. 문제는 실제 청구 비용이 토큰당 가격만으로 결정되지 않는다는 점입니다.
할인은 tokenizer 변화를 흡수하는 장치이기도 합니다
가격표에서 가장 중요한 주석은 tokenizer입니다. Claude pricing 문서 ↗는 Claude Sonnet 5가 Claude Opus 4.7 이후 Opus 모델, Fable 5, Mythos 5와 함께 새로운 tokenizer를 사용한다고 설명합니다. 같은 텍스트가 이전 tokenizer보다 대략 30% 더 많은 토큰으로 계산될 수 있다는 설명도 붙어 있습니다.
그래서 Sonnet 5의 introductory pricing은 단순히 33% 할인으로만 보면 부족합니다. 같은 입력이 더 많은 토큰으로 잡히는 변화를 일정 부분 상쇄하는 가격 완충 장치로도 봐야 합니다.
예를 들어 같은 작업이 Sonnet 4.6에서 입력 100만 토큰으로 계산되던 경우, Sonnet 5에서 tokenizer 영향으로 입력 130만 토큰에 가까워질 수 있습니다. 이때 8월 31일까지는 입력 단가가 낮아서 비용 충격이 작지만, 9월 1일부터는 표준 가격으로 다시 계산해야 합니다.
effort가 실제 비용을 더 크게 흔듭니다
Sonnet 5가 일반 채팅 모델이 아니라 에이전트 실행 모델로 쓰일수록 effort ↗의 영향이 커집니다. effort는 Claude가 응답에 얼마나 많은 토큰과 작업량을 쓸지 조절하는 파라미터입니다. 문서에 따르면 텍스트 응답뿐 아니라 tool call, function argument, thinking 관련 토큰에도 영향을 줍니다.
effort 문서 ↗는 Claude Sonnet 5의 기본값을 high로 설명합니다. xhigh는 어려운 코딩·에이전트 작업에, medium은 비용을 줄이고 싶은 일반 에이전트 작업에, low는 대량 처리나 지연 시간에 민감한 작업에 어울립니다.
| effort | Sonnet 5에서 먼저 테스트할 작업 |
|---|---|
low | 짧은 요약, 단순 분류, 대량 서브태스크 |
medium | 비용을 줄이고 싶은 일반 자동화 작업 |
high | 기본값. 코드 수정, 복잡한 추론, 도구 사용 작업 |
xhigh | 장시간 코딩, 복잡한 디버깅, 긴 에이전트 작업 |
max | 비용보다 최고 성능이 중요한 검증 작업 |
같은 Sonnet 5라도 medium과 xhigh는 작업당 비용이 크게 달라질 수 있습니다. 따라서 할인 기간의 목표는 “Sonnet 5가 좋은가”를 확인하는 것이 아니라, 작업 유형별로 어떤 effort가 충분한지 찾는 것입니다.
8월 31일까지는 벤치마크 창입니다
Anthropic은 공식 발표 ↗에서 Sonnet 5가 Sonnet 4.6보다 reasoning, tool use, coding, knowledge work에서 개선됐고, Opus 4.8에 가까운 성능을 더 낮은 가격으로 제공한다고 설명합니다. 또 BrowseComp와 OSWorld-Verified 차트에서 Sonnet 5가 effort 수준에 따라 넓은 비용-성능 선택지를 제공한다고 소개합니다.
이 설명이 맞는지 확인하려면 팀의 실제 작업으로 봐야 합니다. 특히 Claude Code, 코드 리뷰 자동화, 리서치 에이전트, CRM·문서 자동화처럼 도구 호출이 많은 작업은 벤치마크 점수보다 완료율과 재시도 비용이 더 중요합니다.
할인 기간에는 다음 지표를 남기는 것이 좋습니다.
- 같은 작업을 Sonnet 4.6, Sonnet 5, Opus 4.8에 나눠 실행했을 때 완료율
- 성공한 작업 기준 총 입력 토큰, 출력 토큰, cache hit 비율
- 실패 후 재시도까지 포함한 작업당 총비용
medium,high,xhigheffort별 품질 차이- 2026년 9월 1일 이후 표준 가격으로 재계산한 예상 월 비용
이렇게 보면 introductory pricing은 할인이라기보다 실험 비용을 낮춰주는 기간입니다. 좋은 모델을 싸게 쓰는 것보다, 정가 전환 후에도 남길 워크로드를 고르는 것이 더 중요합니다.
기존 Sonnet 5 글과 어떻게 나눠 읽을까
Sonnet 5의 전체 포지셔닝, benchmark, 안전성 평가는 Claude Sonnet 5 출시 글에서 이미 다뤘습니다. 이 글은 그중 가격 구간과 비용 검증만 따로 떼어 본 보완 포스트입니다.
비교 기준을 넓히려면 Claude Sonnet 4.6 심층 분석도 함께 보면 좋습니다. Sonnet 4.6이 “중간 모델이 Opus급 성능에 접근한다”는 흐름을 만들었다면, Sonnet 5는 그 흐름을 에이전트 실행과 effort 조절로 더 밀어붙입니다.
Claude Opus 4.8 글은 상위 모델을 어디에 남겨둘지 판단할 때 참고할 수 있습니다. 모든 작업을 Sonnet 5로 내리는 것보다, 실패 비용이 큰 판단 작업은 Opus급에 남기고 반복 실행은 Sonnet 5로 보내는 식의 모델 라우팅이 더 현실적입니다.
마무리
Claude Sonnet 5의 가격 할인은 입력 $2, 출력 $10이라는 숫자보다 “지금 실제 워크로드로 측정해보라”는 신호에 가깝습니다. 8월 31일까지는 할인 가격이 tokenizer 변화와 에이전트 실험 비용을 어느 정도 흡수해줍니다.
하지만 9월 1일부터는 입력 $3, 출력 $15가 표준 가격입니다. 그래서 지금 해야 할 일은 Sonnet 5를 막연히 기본 모델로 바꾸는 것이 아니라, 작업별 성공률과 재시도 비용을 남기고 정가 기준으로 다시 계산하는 것입니다.
Sonnet 5가 에이전트 작업을 더 끝까지 처리한다면 토큰당 가격이 아니라 작업당 총비용에서 이길 수 있습니다. 할인 기간의 진짜 목적은 그 지점을 찾는 데 있습니다.