AI情报Jun 28, 2026AI情报文章普林斯顿研究者创建了CEO-Bench,测试AI代理在虚构的软件公司中运行500个模拟天。大多数当前模型会破产,而一个简单的基于规则的启发式方法(无AI)几乎击败了所有模型,揭示了当前AI在长期商业决策中的局限。Data Cube AI 编辑部2026年6月28日来源: The Decoder01来源简报普林斯顿研究者创建了CEO-Bench,测试AI代理在虚构的软件公司中运行500个模拟天。大多数当前模型会破产,而一个简单的基于规则的启发式方法(无AI)几乎击败了所有模型,揭示了当前AI在长期商业决策中的局限。02相关话题研发AI研究商业策略基准CEO-Bench查看本期