AI情报May 17, 2026AI情报文章一个名为SOOHAK的新数学基准测试表明,AI模型甚至对于无法解决的问题也自信地提供错误答案。这些结果突显了当前AI系统在逻辑推理方面的局限性。Data Cube AI 编辑部2026年5月17日来源: The Decoder01来源简报一个名为SOOHAK的新数学基准测试表明,AI模型甚至对于无法解决的问题也自信地提供错误答案。这些结果突显了当前AI系统在逻辑推理方面的局限性。02相关话题研发AI安全基准测试逻辑查看本期