Claude Opus 4.8 が1Mトークン文脈と会話途中システム指示に対応
長時間タスクやプロンプトキャッシュ維持に悩む開発者は、1Mトークン文脈の Claude Opus 4.8 と会話途中のシステム指示で、指示を変えてもキャッシュを保ったまま方針を切り替えられる。Claude Code では Auto mode 拡大と Workflows プレビューも届く。
概要
長時間タスクやキャッシュ維持に悩む開発者は、1M トークン文脈の Claude Opus 4.8 と会話途中のシステム指示で、指示変更時もキャッシュを保ったまま方針を切り替えられる。
長いセッションの途中で前提や方針が変わると、プロンプトキャッシュ(直前の入力を再利用して課金・遅延を抑える仕組み)が無効になりがちだった開発者に向けて、Anthropic は Claude Opus 4.8(claude-opus-4-8)と会話途中のシステム指示を投入した。Claude API・Amazon Bedrock・Vertex AI では 1M トークンの文脈を既定で扱える。Claude Code 側にも Auto mode の拡大や Workflows のプレビューが届く。
変更点
Claude Opus 4.8 が1Mトークン文脈と128k出力に対応
Anthropic は最も高性能な一般提供モデルとして Claude Opus 4.8 を公開した。Claude API・Amazon Bedrock・Vertex AI では既定で 1M トークンのコンテキストウィンドウ(一度に渡せる入力の上限)を扱える。最大出力は 128k トークンで、ツールやプラットフォーム機能は Opus 4.7 と同一だ。プラットフォーム別の既定文脈長は次のとおり。
| プラットフォーム | 既定コンテキスト |
|---|---|
| Claude API | 1M トークン |
| Amazon Bedrock | 1M トークン |
| Vertex AI | 1M トークン |
| Microsoft Foundry | 200k トークン |
長時間セッション中にシステム指示を差し込める
会話途中のシステム指示(mid-conversation system messages)が追加された。Opus 4.8 では messages 配列でユーザーターンの後に role: "system" のメッセージを送れる(配置ルールあり)。これにより長時間セッションの途中で指示を変えても、プロンプトキャッシュのヒットを保てる。ベータヘッダーは不要だ。
拒否応答を category 付きで振り分けられる
拒否応答に付く stop_details フィールドが公式ドキュメントに載った。category(cyber、bio、または null)と人間が読める explanation を返す。アプリ側で拒否の種類ごとに次の処理へ振り分けられる。こちらもベータヘッダーは要らない。
effort既定値とadaptive thinkingで思考トークンを削減
Opus 4.8 では effort パラメータが Claude Code と Messages API を含む全面で high を既定値とする。adaptive thinking(必要なターンだけ推論する仕組み)を有効にすると、同じ effort でも Opus 4.7 より無駄な思考トークンを抑えられる。プロンプトキャッシュの最小対象長は 1,024 トークンに下がった。
Claude Code で Auto mode 拡大とWorkflowsプレビュー
Claude Code では長時間タスク向けの Auto mode がより多くのユーザーに拡大された。Max プランの利用者は Opus 4.8 で fast mode(高速応答モード)が既定になる。さらに Workflows がリサーチプレビューとして提供され、複数ステップのエージェント的な計画を定義・実行できる。
Opus 4.6 の fast mode は約30日後に廃止
Opus 4.6 向けの fast mode は廃止予定で、公開から約 30 日後に削除される。移行先は Opus 4.8 または Opus 4.7 の fast mode だ。なお Opus 4.8 でも temperature・top_p・top_k を既定以外に設定すると 400 エラーを返す点は Opus 4.7 と同じである。
開発者への影響
Opus 4.8 への移行はキャッシュ維持と思考トークン削減の両面で利点が大きい。長時間セッションを回す開発者は会話途中のシステム指示を組み込むと方針変更が安価になる。Claude Code 利用者は Auto mode と Workflows のプレビューを試す価値がある。
使い方の一例
使い方の一例として、Messages API の messages 配列でユーザーターンの後に {"role":"system","content":"方針を変更"} を追加すると、長時間セッションの途中で指示を変えてもプロンプトキャッシュのヒットを保ったまま方針を切り替えられる(claude-opus-4-8 で利用、ベータヘッダー不要)。