YAMATO · Claude Code

トークンコスト チートシート

「何をすると、どれくらい高くなるのか」を握るための1枚。お願いする側の判断用。

いちばん大事な1行

重いもの(画像・動画・大量ファイル・巨大調査)はスクリプト/Geminiにやらせて結果だけ見る。Claudeに直接「見せる/読ませる」と、その分が会話に居座って毎ターン課金される。

迷ったら一言: 「これは目を通す必要ある? 処理だけならスクリプトに投げられる?」 と聞けばOK。安い経路に振り分けます。

① 何が課金されるのか

モデルの“文脈(会話)”を通ったものだけ課金。
スクリプト処理(PIL・Gemini API・pandas・ffmpeg…)=Claudeトークン0。 バイトは会話に入らない。
私が Read / vision で「見る」 と会話に入って課金。
文脈に入った物は毎ターン再送される(再読込)。
コスト ≒ そのトークン量 × 居座るターン数。だから長く続くほど効く。
再読込はキャッシュ(通常単価の約1割)だが、積み上がると主役級になる。

② セッションの長さは“二乗”で効く

累計 ≒ 文脈サイズ × ターン数 ÷ 2。長さ2倍 → コスト約4倍。
同じ作業を…cache読込(目安)換算
1セッション(452応答・51万文脈)1.3億≈¥10,200
4分割(各完結)約3,000万≈¥2,300
独立した成果物が複数あるなら、こまめに新セッションが最大の節約。ただし一続きの推論の途中では切らない(文脈を失って手戻り)。「1まとまった成果物=1セッション」。

③ 画像・メディアの正しい感覚

④ モデルの選び方

用途モデル
単純・量産(WR/Excel/画像バッチ/文言修正)Sonnet(または Opus Fast)
難度高・推論・設計・契約・SoTOpus
Sonnetは手戻りが増えがちなので、難しい作業を無理に落とさない。長セッション対策(こまめ分割)の方が効果も大きく副作用も少ない。

⑤ モデルを途中で変える時

切替直後の1ターンだけ、現文脈をフル単価で1回だけ再読込(恒久ではない・文脈が大きいほど高い)。
=「上げるは途中でも早めに/下げるは新セッションで」。終盤での行き来は地味に高い。
握るのはこれだけ:重い処理はスクリプト/Geminiへ・成果物ごとにセッションを切る・モデルは開始時に決める。
社内向け参照用 / 2026-06-08