トークンコスト計算機
トークン数とモデルレートからコストを見積もる、手早いチェック用ページ。
The problem
トークンコストは予測しやすいです。ポイントは『自分が送るつもりだったトークン』ではなく『請求されるトークン』に置き換えること。
手順 1:input と output を分ける
入力はプロンプト/文脈。出力はモデルの応答です。
手順 2:レートを当てる
Cost per request = input_tokens * input_rate + output_tokens * output_rate
さらにユーザー操作あたりのリクエスト数を掛け算します。
ミニ例
- input_tokens: 8,000
- output_tokens: 2,500
- requests/day: 5,000 呼び出し回数とトークンが増えるほど、コストも直線的に伸びます。
Next
トークン使用量を減らす