如何降低 GPT 的成本

通过控制 max tokens、选择合适模型、避免成本突刺，降低 GPT 支出。

The problem

GPT 成本突刺通常来自“输出太长”和“反复润色循环”，让调用次数和输出 tokens 一起膨胀。

GPT 花钱的隐藏点

输出过长（草稿 → 修改 → 再改）
工具失败后重复追问同一信息
简单步骤却用了高价模型

你需要盯的两类指标

每次调用的计费 tokens + 你的工作流每次用户操作触发了多少次调用。

例子

产品更新页：先写草稿，再做两轮重写。把步骤压缩到更结构化的一次，并限制 max output tokens，计费 tokens 会下降但不必牺牲清晰度。

优化计划

每一步用合适的模型
限制 retries 和 max output tokens
品质足够就提前停止

清单

max tokens + stop 序列
减少重写轮数
给 agent 上预算护栏

Next

试试 AI 成本计算器