GPT-5.5、AISI評価で最強級のサイバー能力を記録　Claude Mythosに続き

※記事を視覚化したイメージであり、実際の事象とは異なります。

2026.05.04

本サイトの記事や画像は、AIが公的資料や複数の報道を基に事実関係を整理・再構成し制作したものです。[続きを表示]特定の報道内容や表現を再利用・要約することを目的としたものではありません。ただし、誤りや不確定な情報が含まれる可能性がありますので、参考の一助としてご覧いただき、実際の判断は公的資料や各出典元の原文をご確認ください。[私たちの取り組み]

英AI Security Institute（AISI）は4月30日、OpenAIのGPT-5.5に対するサイバーセキュリティ能力評価を公表し、自らが試験した中で「最も強い部類のモデルの一つ」と位置づけた。GPT-5.5は、複数段階の企業ネットワーク攻撃シミュレーションをエンドツーエンドで解いた2番目のモデルとなった。4月にClaude Mythos Previewで確認された伸びが特定モデルだけの現象なのか、フロンティアAI全体の上昇局面なのかを測る文脈で、GPT-5.5の結果は後者の可能性を強める材料となった。

Expert級で71.4%、最上位群は拮抗

高度タスク群のExpert級では、GPT-5.5の平均成功率は71.4%（±8.0）だった。Claude Mythos Previewの68.6%（±8.7）、GPT-5.4の52.4%（±9.8）、Opus 4.7の48.6%（±10.0）を上回り、この指標ではGPT-5.5が最強の可能性がある。一方で、OpenAIのSystem Cardは、UK AISIが全体として最も高い成績と判断したものの、差は誤差範囲内だと整理している。

別指標では、Expert級のnarrow cyber tasksでpass@5が90.5%（±12.9）、pass@1が66.7%（±15.9）だった。AISIブログの平均成功率とは粒度が異なり、単純な横並び比較はできないが、最上位モデル群の能力が高い水準で接近していることを示す結果となった。

企業ネットワーク攻撃シミュレーション「The Last Ones」では、AISIの最新記事によると、GPT-5.5が32段階の課題を10回中2回完遂した。OpenAIのSystem Cardでは当初1回とされていたが、AISIは採点不具合の補正後に結果を更新したと説明している。同シミュレーションは熟練者で約20時間を要すると見積もられ、GPT-5.4とGPT-5.3-Codexは完遂できなかった。ただし、示唆されるのは小規模で防御の弱い企業ネットワークに対する条件付きの能力であり、能動的防御や監視など現実環境の要素は省かれている。別の産業制御システム（ICS）レンジは解けなかった。

公開版と切り分けが必要な評価条件

評価対象は、公開中の通常挙動そのものと同一視できない。UK AISIは、代表的なローンチ用チェックポイントに加え、サイバー能力向けに拒否設定を弱めた別チェックポイントの提供を受けて評価した。公開版ChatGPTや将来のAPI提供形態で同じ挙動になるかは、公開資料だけでは詰め切れない。

OpenAIは自社のPreparedness Framework上、GPT-5.5のサイバー能力をHighと位置づけ、Criticalには達していないとした。現実の標的に対して機能するフルチェーン攻撃や、検証者が確認したCritical級アウトカムは出せなかったためだ。

今回の焦点は、GPT-5.5単体の強さよりも、Claude Mythos Previewに続いて別開発元のモデルでも同水準の攻撃能力が観測された点にある。AISIは、こうした伸びが単独企業の特異な飛躍ではなく、より広い傾向である可能性を示すとみている。ただし、現実の防御下にあるネットワークを自律的に突破できる段階とまでは言えない。

Expert級で71.4%、最上位群は拮抗

公開版と切り分けが必要な評価条件

参考・出典