Skip to content
Intelligence IAJul 3, 2026Intelligence IA
Article

L'institut UK IA de sécurité a constaté que les références standard de l'IA sous-estiment systématiquement les capacités réelles...

Des agents d'IA en plafonnant les budgets de calcul. Sur les tâches d'ingénierie logicielle, les taux de réussite ont augmenté d'environ 25 % lorsque les agents ont reçu plus de temps de calcul. Cela soulève des questions sur la validité des tests de sécurité actuels.

Redaction Data Cube AISource: The Decoder
01

Brief source

L'institut UK IA de sécurité a constaté que les références standard de l'IA sous-estiment systématiquement les capacités réelles des agents d'IA en plafonnant les budgets de calcul. Sur les tâches d'ingénierie logicielle, les taux de réussite ont augmenté d'environ 25 % lorsque les agents ont reçu plus de temps de calcul. Cela soulève des questions sur la validité des tests de sécurité actuels.