AI情报May 28, 2026AI情报文章根据 Artificial Analysis 和 IBM 的新 'ITBench-AA' 基准测试,即使是前沿 AI 模型在代理企业 IT 任务上的得分也低于 50%。这表明 AI 代理尚未准备好应对复杂的公司流程。Data Cube AI 编辑部2026年5月27日来源: Hugging Face Blog01来源简报根据 Artificial Analysis 和 IBM 的新 'ITBench-AA' 基准测试,即使是前沿 AI 模型在代理企业 IT 任务上的得分也低于 50%。这表明 AI 代理尚未准备好应对复杂的公司流程。02相关话题研究基准测试AI代理可靠性查看本期