Agent 的 AI 成本

Agent 成本就是工作流成本。学习如何限制重试、避免循环，让 tokens 始终在可控范围。

The problem

成本惊喜通常发生在 agent 发生重试、工具链反复执行，且无法收敛的情况下。

为什么 agent 容易烧预算

工具重试会让调用次数倍增
长推理会带来更多 tokens
没有收敛信号就会形成循环

成本分解

Agent 成本 = 所有模型调用的 tokens + 工具上下文带来的 tokens + 重试带来的额外开销。

例子

agent 反复执行同一段 tool-call 序列，因为停止条件一直没有满足。

护栏方案

限制 retries 和深度
加入收敛规则：达到目标就停
为每个 agent 设置预算与告警

快速清单

阻止 runaway loops
简单步骤用路由
按 run 追踪 agent 成本

Next

学习成本护栏