Skip to content
AI情报May 28, 2026AI情报
文章

根据 Artificial Analysis 和 IBM 的新 'ITBench-AA' 基准测试,即使是前沿 AI 模型在代理企业 IT 任务上的得分也低于 50%。这表明 AI 代理尚未准备好应对复杂的公司流程。

Data Cube AI 编辑部来源: Hugging Face Blog
01

来源简报

根据 Artificial Analysis 和 IBM 的新 'ITBench-AA' 基准测试,即使是前沿 AI 模型在代理企业 IT 任务上的得分也低于 50%。这表明 AI 代理尚未准备好应对复杂的公司流程。