Skip to content
AI情报Feb 15, 2026AI情报
文章

一项新研究警告称,用于排名AI模型的流行平台在统计上很脆弱。测试设置的微小变化都可能显著改变排名。这质疑了许多影响投资和使用决策的公开AI比较的可信度。

Data Cube AI 编辑部来源: The Decoder
01

来源简报

一项新研究警告称,用于排名AI模型的流行平台在统计上很脆弱。测试设置的微小变化都可能显著改变排名。这质疑了许多影响投资和使用决策的公开AI比较的可信度。