AI情报Jun 19, 2026AI情报文章一项新基准测试显示,即使是最好的AI模型在现实知识工作中也会失败,仅能完全解决3%的任务。这凸显了AI在复杂的多步骤工作流中的当前局限。Data Cube AI 编辑部2026年6月19日来源: The Decoder01来源简报一项新基准测试显示,即使是最好的AI模型在现实知识工作中也会失败,仅能完全解决3%的任务。这凸显了AI在复杂的多步骤工作流中的当前局限。02相关话题研究与开发基准AI知识工作局限查看本期