AI Cost Save
AICostSave

Claude: Kosten pro Token (was tracken)

Claude-Kosten schätzen, inkl. input/output Token und Call-Volume eures Workflows.

The problem

Kosten werden unklar, wenn ihr ständig viel Kontext sendet oder Agents zusätzliche Refinement-Calls auslösen.

Claude in einfache Begriffe übersetzt

Denkt in input Tokens (Kontext) und output Tokens (Antworten) – und addiert das Call-Volume.

Kostenaufteilung

  • Kontext (Prompt/Tokens)
  • Response/Output Tokens
  • Workflow-Calls: Retries, Tools, „draft → refine“-Loops

Beispiel

Input/Output Tokens mit ihren Raten multiplizieren und dann mit Calls pro Nutzeraktion skalieren.

Checkliste

  • Kontext kürzen (Summaries + Retrieval)
  • max output tokens cap
  • Guardrails gegen Runaway-Loops