Claude : coût par token (quoi suivre)
Estimer Claude en séparant input/output et en tenant compte du volume de calls.
The problem
Le coût devient flou quand l’app renvoie trop de contexte ou quand les agents déclenchent des passes de révision supplémentaires.
Prix Claude expliqué simplement
Pensez en input tokens (contexte) et output tokens (réponses), puis ajoutez le volume d’appels.
Décomposition du coût
- Contexte (prompt/tokens)
- Sorties (output tokens)
- Appels workflow : retries, outils, boucles “draft → refine”
Exemple
Multipliez input/output par leurs taux, puis scalisez selon le nombre d’appels par action utilisateur.
Checklist
- Raccourcir le contexte (résumés + retrieval)
- Plafonner max output tokens
- Ajouter des garde-fous contre les boucles
