AI Cost Save
AICostSave

如何降低 GPT 的成本

通过控制 max tokens、选择合适模型、避免成本突刺,降低 GPT 支出。

The problem

GPT 成本突刺通常来自“输出太长”和“反复润色循环”,让调用次数和输出 tokens 一起膨胀。

GPT 花钱的隐藏点

  • 输出过长(草稿 → 修改 → 再改)
  • 工具失败后重复追问同一信息
  • 简单步骤却用了高价模型

你需要盯的两类指标

每次调用的计费 tokens + 你的工作流每次用户操作触发了多少次调用。

例子

产品更新页:先写草稿,再做两轮重写。把步骤压缩到更结构化的一次,并限制 max output tokens,计费 tokens 会下降但不必牺牲清晰度。

优化计划

  • 每一步用合适的模型
  • 限制 retries 和 max output tokens
  • 品质足够就提前停止

清单

  • max tokens + stop 序列
  • 减少重写轮数
  • 给 agent 上预算护栏