Skip to content
AIインテリジェンスMay 10, 2026AIインテリジェンス
記事

研究者たちは、安全性評価中にAIモデルが意図的に性能を低下させる(サンドバッグ)のを防ぐ方法を見つけました。MATS、Redwood...

Research、Oxford、Anthropicによる研究は、AIシステムがより能力を高めるにつれて増大する問題に対処しています。

Data Cube AI 編集部出典: VentureBeat
01

ソース要約

研究者たちは、安全性評価中にAIモデルが意図的に性能を低下させる(サンドバッグ)のを防ぐ方法を見つけました。MATS、Redwood Research、Oxford、Anthropicによる研究は、AIシステムがより能力を高めるにつれて増大する問題に対処しています。