YAMATO · Claude Code
トークンコスト チートシート
「何をすると、どれくらい高くなるのか」を握るための1枚。お願いする側の判断用。
いちばん大事な1行
重いもの(画像・動画・大量ファイル・巨大調査)はスクリプト/Geminiにやらせて結果だけ見る。Claudeに直接「見せる/読ませる」と、その分が会話に居座って毎ターン課金される。
迷ったら一言: 「これは目を通す必要ある? 処理だけならスクリプトに投げられる?」 と聞けばOK。安い経路に振り分けます。
① 何が課金されるのか
モデルの“文脈(会話)”を通ったものだけ課金。
スクリプト処理(PIL・Gemini API・pandas・ffmpeg…)=Claudeトークン0。 バイトは会話に入らない。
私が Read / vision で「見る」 と会話に入って課金。
文脈に入った物は毎ターン再送される(再読込)。
コスト ≒ そのトークン量 × 居座るターン数。だから長く続くほど効く。
再読込はキャッシュ(通常単価の約1割)だが、積み上がると主役級になる。
② セッションの長さは“二乗”で効く
累計 ≒
文脈サイズ × ターン数 ÷ 2。長さ2倍 → コスト約4倍。
| 同じ作業を… | cache読込(目安) | 換算 |
| 1セッション(452応答・51万文脈) | 1.3億 | ≈¥10,200 |
| 4分割(各完結) | 約3,000万 | ≈¥2,300 |
→ 独立した成果物が複数あるなら、こまめに新セッションが最大の節約。ただし一続きの推論の途中では切らない(文脈を失って手戻り)。「1まとまった成果物=1セッション」。
③ 画像・メディアの正しい感覚
- 画像トークンは解像度(ピクセル)で決まる。MBではない — 5MB写真も小さい写真も、同寸法ならほぼ同じ。
- 1枚 ≒ 約1,500〜5,000トークン(高解像で最大約4,800)。※近似
- スクリプト/Geminiで処理=0トークン。 私が目視レビューすると枚数ぶん課金。
- 大量の写真処理 → スクリプト/Geminiに丸投げ。私が見るのは最終1〜2枚を低解像で、に絞る。
④ モデルの選び方
| 用途 | モデル |
| 単純・量産(WR/Excel/画像バッチ/文言修正) | Sonnet(または Opus Fast) |
| 難度高・推論・設計・契約・SoT | Opus |
Sonnetは手戻りが増えがちなので、難しい作業を無理に落とさない。長セッション対策(こまめ分割)の方が効果も大きく副作用も少ない。
⑤ モデルを途中で変える時
切替直後の1ターンだけ、現文脈を
フル単価で1回だけ再読込(恒久ではない・文脈が大きいほど高い)。
- 上げる(Sonnet→Opusで詰まった時):途中でも可。コツは早め=文脈が小さいうちに1回。
- 下げる(Opus→Sonnet):途中切替より新しいSonnetセッションを開く方が得(再読込を避け、重い文脈も捨てられる)。
=「上げるは途中でも早めに/下げるは新セッションで」。終盤での行き来は地味に高い。