米AI企業Anthropic、高リスク領域の悪用防ぐ安全設計のClaude Fable 5公開

Anthropic、「ClaudeFable5」を一般公開 Mythos級の能力に安全策を組み込む

※記事を視覚化したイメージであり、実際の事象とは異なります。

本サイトの記事や画像は、AIが公的資料や複数の報道を基に事実関係を整理・再構成し制作したものです。[続きを表示]特定の報道内容や表現を再利用・要約することを目的としたものではありません。ただし、誤りや不確定な情報が含まれる可能性がありますので、参考の一助としてご覧いただき、実際の判断は公的資料や各出典元の原文をご確認ください。[私たちの取り組み]

Anthropicは2026年6月9日、Mythos級の能力を一般利用向けに安全化した新モデル「Claude Fable 5」を公開した。一般公開にあたり、サイバーセキュリティーや生物・化学領域の一部高リスク要求を検知し、必要に応じてClaude Opus 4.8へ切り替えるガードレールを組み込んだ。フロンティア級AIの能力を広く提供しながら、悪用リスクの高い用途を制御する設計を打ち出した形だ。

一般向けと認定済みパートナー向けを分けた二層展開

今回の展開では、一般利用向けの「Claude Fable 5」と、少数のサイバー防御者やインフラ提供者向けに限定提供する「Claude Mythos 5」が分けて用意された。Anthropicによると、両モデルは同じ基盤モデルを使うが、Fable 5ではサイバーセキュリティーや生物分野などに追加の安全策を組み込む。高い推論能力をそのまま広く開放するのではなく、一般向けには制限付きの版を提供し、より高リスクな用途は信頼済みの相手に限る構図だ。

Anthropicは公式ヘルプ文書で、同社の最も高性能なClaudeモデル群に対し、禁止的なサイバー活動と「High Risk Dual use」に当たる活動を自動検知し、遮断するリアルタイムのサイバー安全策を導入していると説明している。禁止用途には、大規模なデータ窃取やランサムウェアのコード開発のように、正当な防御目的が乏しい行為が含まれる。

一方の「High Risk Dual use」は、脆弱性の悪用や攻撃的セキュリティーツールの開発など、防御にも攻撃にも使いうる高リスク行為を指す。デュアルユースとは、同じ技術が善用にも悪用にも転じる性質のことだ。サイバー領域では、正当な防御目的の利用者がCyber Verification Programを通じ、審査に基づく例外調整を申請できる枠組みも用意されている。

Project Glasswingで示した強力な実用性

背景には、Claude Mythos級モデルの限定運用で得た実績がある。Anthropicは2日、Project Glasswingの拡大を公表し、4月初旬から約50の初期パートナーにClaude Mythos Previewへのアクセスを提供して以来、1万件超の高深刻度または重大な脆弱性が見つかったと説明した。高度なAIが重要ソフトウェアの弱点発見に大きな力を持つことを示した形だ。

同社はClaude Mythos Previewを最も先進的なモデルと位置付け、能力面で大きな飛躍を示すモデルだとしている。同時に、今後6〜12カ月以内に他社もMythos級モデルを持つ可能性があると警告してきた。強力なモデルが広がれば、防御側の効率は上がる一方、悪用の危険も増す。

Claude Fable 5の公開は、最先端AIの性能競争にとどまらない。Anthropicは、一般利用で扱える能力を広げる一方、サイバーセキュリティーや生物・化学領域の高リスク要求には追加の制御をかける方式を選んだ。今回の発表は、高性能モデルを公開する際に、どの用途を広く認め、どの用途を限定アクセスに回すのかを具体化する動きでもある。

参考・出典

ニュースはAIで深化する—。日々の出来事を深掘りし、次の時代を考える視点をお届けします。

本サイトの記事や画像はAIが公的資料や報道を整理し制作したものです。
ただし誤りや不確定な情報が含まれることがありますので、参考の一助としてご覧いただき、
実際の判断は公的資料や他の報道を直接ご確認ください。
[私たちの取り組み]