成本
Claude Code 的定价硬编码在源代码中。了解这些数字有助于你做出明智的决策,特别是关于快速模式,它对同一模型的成本高出 6 倍。
4 模型层级 6× 快速模式溢价 $0.01 每次网络搜索
! /fast 对同一模型的成本高出 6 倍
快速模式不会切换到不同的模型。它以更高的优先级吞吐量运行相同的 Opus 4.6。
输入成本从 $5/Mtok 跳跃到 $30/Mtok,溢价 6 倍。仅当响应速度确实值得这个价格差异时才使用它。
每个模型的定价
| Model | Input /Mtok | Output /Mtok | Cache Read | Cache Write |
|---|---|---|---|---|
| Haiku 4.5 | $1 | $5 | $0.10 | $1.25 |
| Sonnet 4.x | $3 | $15 | $0.30 | $3.75 |
| Opus 4.5 / 4.6 | $5 | $25 | $0.50 | $6.25 |
| Opus 4.6 (fast mode) 6× premium | $30 | $150 | $3 | $37.50 |
| Web Search | $0.01 / request | |||
Mtok = million tokens
默认模型选择
Max / Team Premium subscribers
Opus 4.6 [1m]
1M context window, most capable model
All other users
Sonnet 4.6
200K context window, strong performance
i 缓存读取比新读取便宜 90%
提示词缓存显著降低了系统提示词静态部分的成本
(
__SYSTEM_PROMPT_DYNAMIC_BOUNDARY__ 之上的所有内容)。
长会话也会从大文件的重复读取缓存命中中受益。