YAMATO · Claude Code

トークンコストチートシート

「何をすると、どれくらい高くなるのか」を握るための1枚。お願いする側の判断用。

いちばん大事な1行

重いもの（画像・動画・大量ファイル・巨大調査）はスクリプト/Geminiにやらせて結果だけ見る。Claudeに直接「見せる/読ませる」と、その分が会話に居座って毎ターン課金される。

迷ったら一言: 「これは目を通す必要ある？　処理だけならスクリプトに投げられる？」 と聞けばOK。安い経路に振り分けます。

① 何が課金されるのか

モデルの“文脈（会話）”を通ったものだけ課金。
スクリプト処理（PIL・Gemini API・pandas・ffmpeg…）＝Claudeトークン0。バイトは会話に入らない。
私が Read / vision で「見る」 と会話に入って課金。

文脈に入った物は毎ターン再送される（再読込）。
コスト ≒ そのトークン量 × 居座るターン数。だから長く続くほど効く。
再読込はキャッシュ（通常単価の約1割）だが、積み上がると主役級になる。

累計 ≒ 文脈サイズ × ターン数 ÷ 2。長さ2倍 → コスト約4倍。

同じ作業を…	cache読込(目安)	換算
1セッション（452応答・51万文脈）	1.3億	≈¥10,200
4分割（各完結）	約3,000万	≈¥2,300

→ 独立した成果物が複数あるなら、こまめに新セッションが最大の節約。ただし一続きの推論の途中では切らない（文脈を失って手戻り）。「1まとまった成果物＝1セッション」。

用途	モデル
単純・量産（WR/Excel/画像バッチ/文言修正）	Sonnet（または Opus Fast）
難度高・推論・設計・契約・SoT	Opus

Sonnetは手戻りが増えがちなので、難しい作業を無理に落とさない。長セッション対策（こまめ分割）の方が効果も大きく副作用も少ない。

切替直後の1ターンだけ、現文脈をフル単価で1回だけ再読込（恒久ではない・文脈が大きいほど高い）。

＝「上げるは途中でも早めに／下げるは新セッションで」。終盤での行き来は地味に高い。

握るのはこれだけ：重い処理はスクリプト/Geminiへ・成果物ごとにセッションを切る・モデルは開始時に決める。
社内向け参照用 / 2026-06-08