如何降低 GPT 的成本
通过控制 max tokens、选择合适模型、避免成本突刺,降低 GPT 支出。
The problem
GPT 成本突刺通常来自“输出太长”和“反复润色循环”,让调用次数和输出 tokens 一起膨胀。
GPT 花钱的隐藏点
- 输出过长(草稿 → 修改 → 再改)
- 工具失败后重复追问同一信息
- 简单步骤却用了高价模型
你需要盯的两类指标
每次调用的计费 tokens + 你的工作流每次用户操作触发了多少次调用。
例子
产品更新页:先写草稿,再做两轮重写。把步骤压缩到更结构化的一次,并限制 max output tokens,计费 tokens 会下降但不必牺牲清晰度。
优化计划
- 每一步用合适的模型
- 限制 retries 和 max output tokens
- 品质足够就提前停止
清单
- max tokens + stop 序列
- 减少重写轮数
- 给 agent 上预算护栏
Next
试试 AI 成本计算器