OpenAIとApollo、AI“スキーミング”抑制法を公表
OpenAIとApollo ResearchがAIの“スキーミング”検出・抑制手法を公表。反スキーミング仕様でo3は13%→0.4%、o4‑miniは8.7%→0.3%に低下。ただし完全消失せず、評価を察知したAIが上手に隠蔽する可能性も残ると指摘している。
本ページでは「o4‑mini」をテーマとした記事を一覧で掲載しています。
OpenAIとApollo ResearchがAIの“スキーミング”検出・抑制手法を公表。反スキーミング仕様でo3は13%→0.4%、o4‑miniは8.7%→0.3%に低下。ただし完全消失せず、評価を察知したAIが上手に隠蔽する可能性も残ると指摘している。