Claude Code、主モデル過負荷時に最大3つの代替モデルへ自動切替
主モデルが過負荷で待たされていた利用者は、最大3つの代替モデルを順に試すfallbackModel設定で作業を続けられる。denyルールのglob対応や、他セッション由来メッセージの権限分離も加わった。
概要
主モデルが過負荷で待たされていた利用者は、最大3つの代替モデルを順に試す fallbackModel 設定で作業を続けられる。deny ルールの glob 対応とセッション間メッセージの権限分離も加わった。
Claude Code v2.1.166 は、主モデルが使えないときの可用性とセキュリティ強化を中心に更新された。最大3つの代替モデルを順に試す fallbackModel 設定、権限 deny ルールでのワイルドカード指定、他セッションから中継されたメッセージの権限分離などを追加している。あわせて起動・IDE・端末まわりの多数の不具合も修正した。
変更点
主モデル過負荷時に最大3モデルへ自動切替
新設定 fallbackModel は、主モデルが過負荷または利用不可のとき順に試す代替モデルを最大3つ登録できる。これで混雑時にセッションが止まらず作業を継続できる。起動フラグ --fallback-model も対話セッションに適用されるようになった。さらに、API が想定外の再試行不可エラーを返した場合、代替モデルでターンを1回だけ再試行する。ただし認証・レート制限・リクエストサイズ・通信エラーは従来どおり即座に表面化する。
deny ルールでワイルドカード指定が可能に
権限の deny ルールのツール名位置で glob パターンを使えるようになった。"*" を指定すると全ツールを拒否できる。一方 allow ルールは MCP 以外の glob を拒否し、deny ルールに未知のツール名があれば起動時に警告する。
他セッション由来メッセージの権限を分離
SendMessage 経由で他の Claude セッションから中継されたメッセージは、ユーザー権限を持たなくなった。これにより受信側は中継された権限リクエストを拒否し、auto モード(自動承認モード)もこれをブロックする。セッションをまたいだ権限の昇格を防ぐセキュリティ強化である。
既定で思考するモデルの思考を無効化できる
MAX_THINKING_TOKENS=0、--thinking disabled、モデル単位の thinking トグルが、Claude API 経由で既定で思考するモデルの思考(thinking)を無効化できるようになった。サードパーティプロバイダ経由のモデルの挙動は変更されない。
起動・IDE・端末まわりの不具合を修正
複数の不具合を修正した。主な内容は次のとおり。
claude updateがダウンロード前に対象バージョンを表示するようになった(従来は無言で進行)。- JetBrains 系 IDE(IntelliJ、PyCharm、WebStorm 等)の 2026.1 以降で、ターミナルのちらつきを同期出力の有効化で解消した。
- Kitty キーボードプロトコルを使う端末(WezTerm、Ghostty、kitty)で
Shift+非ASCII文字(例: Shift+ä → Ä)が欠落する問題を修正した。 - 起動時のワーカー登録中に一時的なバックエンド障害が起きるとリモートセッションが永久に固まる問題を修正した。
- macOS でデーモン(常駐プロセス)の停止後に
claude --bg-pty-hostプロセスが残り、CPU を 100% 使い続ける問題を修正した。
開発者への影響
本バージョンは可用性とセキュリティの両面で実用価値が高い。主モデルが混雑しがちな時間帯に作業する開発者は、fallbackModel で中断を減らせる。deny ルールの glob 対応は権限設計を簡潔にする一方、allow ルールは MCP 以外の glob を拒否する点に注意する。
使い方の一例
使い方の一例として、claude --fallback-model <モデル名> のように起動時フラグで代替モデルを指定すると、本バージョンから対話セッションでも主モデルが使えないときに自動で切り替わる。