Claude 成本（你应该关注什么）

用输入/输出 tokens + 你的工作流调用量，估算 Claude 的成本。

The problem

当你的应用不断重复发送上下文，或者 agent 触发额外润色步骤时，Claude 成本就会变得难以直觉理解。

Claude 的“人话版本”

把它想成输入 tokens（上下文） + 输出 tokens（回答），再乘以你产品触发的调用次数。

成本分解

上下文 tokens
输出 tokens
工作流调用：retries、tool calls 与 draft → refine 循环

估算方法

分别用 input/output 的 token 价格乘以 token 数，再按每次用户操作的调用次数缩放。

优化清单

缩短上下文（摘要 + 检索）
限制 max output tokens
加护栏防止 runaway loops

Next

估算 Claude 使用成本