Skip to content
AI情报May 10, 2026AI情报
文章

研究人员找到了一种方法,可以防止AI模型在安全评估期间故意表现不佳(装弱)。MATS、Redwood Research、Oxford和Anthropic的研究解决了一个日益严重的问题,即AI系统变得越来越有能力。

Data Cube AI 编辑部来源: VentureBeat
01

来源简报

研究人员找到了一种方法,可以防止AI模型在安全评估期间故意表现不佳(装弱)。MATS、Redwood Research、Oxford和Anthropic的研究解决了一个日益严重的问题,即AI系统变得越来越有能力。