Skip to content
AI情报Jun 19, 2026AI情报
文章

一项新基准测试显示,即使是最好的AI模型在现实知识工作中也会失败,仅能完全解决3%的任务。这凸显了AI在复杂的多步骤工作流中的当前局限。

Data Cube AI 编辑部来源: The Decoder
01

来源简报

一项新基准测试显示,即使是最好的AI模型在现实知识工作中也会失败,仅能完全解决3%的任务。这凸显了AI在复杂的多步骤工作流中的当前局限。