Claude のコスト(見ておくべきポイント)
入力/出力トークンと、ワークフローが起動する呼び出し回数から Claude コストを見積もる方法。
The problem
Claude のコストは、文脈を送り続ける設計や、エージェントが追加の洗練ステップを起動すると分かりにくくなります。
Claude の価格を言葉で理解する
入力(文脈)トークンと、出力(回答)トークンを分けて考え、その上であなたのプロダクトが発生させる“呼び出し回数”を足します。
コスト分解
- プロンプト/文脈トークン
- 応答/出力トークン
- ワークフロー呼び出し:リトライ、ツール、ドラフト→洗練ループ
例
入力/出力のトークン数をそれぞれのレートに掛け、最後に“1 ユーザー操作あたりの呼び出し回数”でスケールします。
最適化チェック
- 文脈を短く(要約 + 検索)
- max output tokens を上限化
- ガードレールで暴走ループを止める
