Agent 的 AI 成本
Agent 成本就是工作流成本。学习如何限制重试、避免循环,让 tokens 始终在可控范围。
The problem
成本惊喜通常发生在 agent 发生重试、工具链反复执行,且无法收敛的情况下。
为什么 agent 容易烧预算
- 工具重试会让调用次数倍增
- 长推理会带来更多 tokens
- 没有收敛信号就会形成循环
成本分解
Agent 成本 = 所有模型调用的 tokens + 工具上下文带来的 tokens + 重试带来的额外开销。
例子
agent 反复执行同一段 tool-call 序列,因为停止条件一直没有满足。
护栏方案
- 限制 retries 和深度
- 加入收敛规则:达到目标就停
- 为每个 agent 设置预算与告警
快速清单
- 阻止 runaway loops
- 简单步骤用路由
- 按 run 追踪 agent 成本
Next
学习成本护栏