AI情报Feb 15, 2026AI情报文章一项新研究警告称,用于排名AI模型的流行平台在统计上很脆弱。测试设置的微小变化都可能显著改变排名。这质疑了许多影响投资和使用决策的公开AI比较的可信度。Data Cube AI 编辑部2026年2月15日来源: The Decoder01来源简报一项新研究警告称,用于排名AI模型的流行平台在统计上很脆弱。测试设置的微小变化都可能显著改变排名。这质疑了许多影响投资和使用决策的公开AI比较的可信度。02相关话题研发AI基准测试研究评估查看本期