Skip to content
Intelligence IAJun 7, 2026Intelligence IA
Article

Les chercheurs ont identifié pourquoi les modèles linguistiques plus grands acquièrent des compétences que les petits modèles...

Manquent : les petits modèles sont écrasés par les tâches fréquentes et ne peuvent pas retenir les rares. L'étude montre que la taille du modèle est cruciale pour apprendre les modèles rares.

Redaction Data Cube AISource: The Decoder
01

Brief source

Les chercheurs ont identifié pourquoi les modèles linguistiques plus grands acquièrent des compétences que les petits modèles manquent : les petits modèles sont écrasés par les tâches fréquentes et ne peuvent pas retenir les rares. L'étude montre que la taille du modèle est cruciale pour apprendre les modèles rares.