Claude 成本(你应该关注什么)
用输入/输出 tokens + 你的工作流调用量,估算 Claude 的成本。
The problem
当你的应用不断重复发送上下文,或者 agent 触发额外润色步骤时,Claude 成本就会变得难以直觉理解。
Claude 的“人话版本”
把它想成输入 tokens(上下文) + 输出 tokens(回答),再乘以你产品触发的调用次数。
成本分解
- 上下文 tokens
- 输出 tokens
- 工作流调用:retries、tool calls 与 draft → refine 循环
估算方法
分别用 input/output 的 token 价格乘以 token 数,再按每次用户操作的调用次数缩放。
优化清单
- 缩短上下文(摘要 + 检索)
- 限制 max output tokens
- 加护栏防止 runaway loops
Next
估算 Claude 使用成本