AI Cost Save
AICostSave

AI Cost per Agent

Agent cost = workflow cost. Impara a capare retries, evitare loop e tenere i token sotto controllo.

The problem

Le sorprese di costo arrivano quando l’agent va in retry, usa tool chain e non trova convergenza.

Perché gli agent bruciano budget

  • retries moltiplicano le chiamate
  • ragionamento lungo = più tokens
  • loop quando manca un segnale di stop

Breakdown

Agent cost = tokens su tutti i model calls + tokens del contesto tool + retries.

Esempio

L’agent ripete una sequenza di tool call perché la condizione di stop non arriva mai.

Guardrails

  • cap retries e depth
  • regola di convergenza (stop quando obiettivo è raggiunto)
  • budget + alert per agent

Checklist

  • stop runaway loops
  • routing per step semplici
  • tracciare cost per run