AI Cost Save
AICostSave

Claude : coût par token (quoi suivre)

Estimer Claude en séparant input/output et en tenant compte du volume de calls.

The problem

Le coût devient flou quand l’app renvoie trop de contexte ou quand les agents déclenchent des passes de révision supplémentaires.

Prix Claude expliqué simplement

Pensez en input tokens (contexte) et output tokens (réponses), puis ajoutez le volume d’appels.

Décomposition du coût

  • Contexte (prompt/tokens)
  • Sorties (output tokens)
  • Appels workflow : retries, outils, boucles “draft → refine”

Exemple

Multipliez input/output par leurs taux, puis scalisez selon le nombre d’appels par action utilisateur.

Checklist

  • Raccourcir le contexte (résumés + retrieval)
  • Plafonner max output tokens
  • Ajouter des garde-fous contre les boucles