Intelligence IAJul 3, 2026Intelligence IA
Article
L'institut UK IA de sécurité a constaté que les références standard de l'IA sous-estiment systématiquement les capacités réelles...
Des agents d'IA en plafonnant les budgets de calcul. Sur les tâches d'ingénierie logicielle, les taux de réussite ont augmenté d'environ 25 % lorsque les agents ont reçu plus de temps de calcul. Cela soulève des questions sur la validité des tests de sécurité actuels.
Redaction Data Cube AISource: The Decoder
01
Brief source
L'institut UK IA de sécurité a constaté que les références standard de l'IA sous-estiment systématiquement les capacités réelles des agents d'IA en plafonnant les budgets de calcul. Sur les tâches d'ingénierie logicielle, les taux de réussite ont augmenté d'environ 25 % lorsque les agents ont reçu plus de temps de calcul. Cela soulève des questions sur la validité des tests de sécurité actuels.