Coût IA pour les agents
Le coût d’un agent = coût de workflow. Apprenez à caper retries, empêcher les boucles et contrôler les tokens.
The problem
Les surprises de coût viennent des retries, des chaînes d’outils et des boucles auto-renforcées.
Pourquoi les agents brûlent le budget
- retries qui multiplient les appels
- plus de tokens via raisonnement long
- boucles quand il n’y a pas de signal de convergence
Décomposition
Agent cost = tokens sur tous les appels + tokens générés par le contexte d’outils + retries.
Exemple
L’agent répète une séquence d’appels d’outils tant que la condition de stop n’est pas atteinte.
Garde-fous
- cap retries et profondeur
- règle de convergence (stop quand le but est atteint)
- budgets + alertes par agent
Checklist
- stop runaway loops
- routing pour les étapes simples
- suivre le coût par run
Next
Garde-fous coûts