KI Intelligence28.06.2026KI Intelligence
Artikel
Forscher der Universität Princeton haben CEO-Bench entwickelt, einen Test, bei dem KI-Agenten ein fiktives Softwareunternehmen...
Tage lang simulieren. Die meisten aktuellen Modelle gehen pleite, und eine einfache regelbasierte Heuristik ohne KI schlägt fast alle Modelle. Dies zeigt die Grenzen heutiger KI bei langfristigen Geschäftsentscheidungen.
Data Cube AI RedaktionQuelle: The Decoder
01
Source Brief
Forscher der Universität Princeton haben CEO-Bench entwickelt, einen Test, bei dem KI-Agenten ein fiktives Softwareunternehmen 500 Tage lang simulieren. Die meisten aktuellen Modelle gehen pleite, und eine einfache regelbasierte Heuristik ohne KI schlägt fast alle Modelle. Dies zeigt die Grenzen heutiger KI bei langfristigen Geschäftsentscheidungen.