OpenAI、Lockdown Modeを発表
検知。2026年6月6日20時32分(UTC)、OpenAIがLockdown Modeを公開した。プロンプトインジェクション攻撃から機密データを守ることを主目的とした機能である。TechCrunchがこれを報じた。
プロンプトインジェクション攻撃とは、悪意ある外部入力をAIモデルに注入し、意図しない動作や情報漏洩を引き起こす攻撃手法だ。ChatGPTのような大規模言語モデルが企業の機密データや個人情報を扱う場面が増えるにつれ、この種の攻撃リスクは業界全体で深刻な課題となっている。Lockdown Modeはその対策として投入された。
「完全防御」ではない——OpenAI自身が認める限界
OpenAI自身が重要な留保を示している。Lockdown Modeを有効にした状態でも、ChatGPTはプロンプトインジェクションに対して依然として脆弱である可能性がある、と明示した。目標はあくまで「機密データが攻撃プロセスで共有される可能性を低減すること」であり、ゼロリスク化ではない。
この姿勢は評価できる。過剰な安全宣言を避け、ユーザーに正確なリスク認識を促す姿勢は、エンタープライズ導入における信頼性の観点から重要だ。ただし、どの程度リスクが低減されるかの具体的な数値——攻撃成功率の変化(%)や検知精度(ms単位の応答遅延への影響等)——は、現時点でソースから確認できない。
記者の視点——数字なき「安全」に注意
今回のLockdown Mode発表で最も注目すべき点は、OpenAIが「完全な防御ではない」と自ら認めたことだ。これは誠実な開示である一方、ユーザー側には冷静な評価が求められる。機密データをChatGPTに渡す運用を行っている企業は、Lockdown Modeの有効化だけで安心するべきではない。攻撃リスクの低減幅が数値で示されない限り、追加的なアーキテクチャ上の対策——入力サニタイズ、出力フィルタリング、最小権限原則の徹底——を並行して維持する必要があると考えられる。ハイプに乗らず、ログと数字で判断する。それだけだ。






