Skip to content
AI情报Jun 28, 2026AI情报
文章

普林斯顿研究者创建了CEO-Bench,测试AI代理在虚构的软件公司中运行500个模拟天。大多数当前模型会破产,而一个简单的基于规则的启发式方法(无AI)几乎击败了所有模型,揭示了当前AI在长期商业决策中的局限。

Data Cube AI 编辑部来源: The Decoder
01

来源简报

普林斯顿研究者创建了CEO-Bench,测试AI代理在虚构的软件公司中运行500个模拟天。大多数当前模型会破产,而一个简单的基于规则的启发式方法(无AI)几乎击败了所有模型,揭示了当前AI在长期商业决策中的局限。