Skip to content
AI情报May 17, 2026AI情报
文章

一个名为SOOHAK的新数学基准测试表明,AI模型甚至对于无法解决的问题也自信地提供错误答案。这些结果突显了当前AI系统在逻辑推理方面的局限性。

Data Cube AI 编辑部来源: The Decoder
01

来源简报

一个名为SOOHAK的新数学基准测试表明,AI模型甚至对于无法解决的问题也自信地提供错误答案。这些结果突显了当前AI系统在逻辑推理方面的局限性。