AI-Kosten für Agents
Agent Costs sind Workflow Costs. Lernt Retries zu capen, Loops zu verhindern und Tokens unter Kontrolle zu halten.
The problem
Kosten-Surprises passieren bei Agent Runs: Retries, Tool-Ketten und self-reinforcing Loops.
Warum Agents Budgets verbrennen
- Tool-Retries multiplizieren Calls
- Long Reasoning erzeugt mehr Tokens
- Loops ohne Konvergenz-Signal
Kostenaufteilung
Agent cost = Tokens über alle Model-Calls + Tokens aus Tool-Kontext + Retries.
Beispiel
Der Agent wiederholt Tool-Call-Sequenzen, weil die Stop-Bedingung nie erreicht wird.
Guardrails
- Retries und Tiefe deckeln
- Convergence-Regel: Stop, wenn Ziel erreicht ist
- Budgets + Alerts pro Agent
Checkliste
- runaway loops stoppen
- einfache Schritte routen
- Agent Cost pro Run tracken
