C Claude Code Internals
| EN | ES

成本

Claude Code 的定价硬编码在源代码中。了解这些数字有助于你做出明智的决策,特别是关于快速模式,它对同一模型的成本高出 6 倍。

4 模型层级 快速模式溢价 $0.01 每次网络搜索
! /fast 对同一模型的成本高出 6 倍
快速模式不会切换到不同的模型。它以更高的优先级吞吐量运行相同的 Opus 4.6。 输入成本从 $5/Mtok 跳跃到 $30/Mtok,溢价 6 倍。仅当响应速度确实值得这个价格差异时才使用它。

每个模型的定价

ModelInput /MtokOutput /MtokCache ReadCache Write
Haiku 4.5 $1 $5 $0.10 $1.25
Sonnet 4.x $3 $15 $0.30 $3.75
Opus 4.5 / 4.6 $5 $25 $0.50 $6.25
Opus 4.6 (fast mode) 6× premium $30 $150 $3 $37.50
Web Search $0.01 / request

Mtok = million tokens

默认模型选择

Max / Team Premium subscribers
Opus 4.6 [1m]
1M context window, most capable model
All other users
Sonnet 4.6
200K context window, strong performance
i 缓存读取比新读取便宜 90%
提示词缓存显著降低了系统提示词静态部分的成本 (__SYSTEM_PROMPT_DYNAMIC_BOUNDARY__ 之上的所有内容)。 长会话也会从大文件的重复读取缓存命中中受益。