Intelligence IAJun 7, 2026Intelligence IA
Article
Les chercheurs ont identifié pourquoi les modèles linguistiques plus grands acquièrent des compétences que les petits modèles...
Manquent : les petits modèles sont écrasés par les tâches fréquentes et ne peuvent pas retenir les rares. L'étude montre que la taille du modèle est cruciale pour apprendre les modèles rares.
Redaction Data Cube AISource: The Decoder
01
Brief source
Les chercheurs ont identifié pourquoi les modèles linguistiques plus grands acquièrent des compétences que les petits modèles manquent : les petits modèles sont écrasés par les tâches fréquentes et ne peuvent pas retenir les rares. L'étude montre que la taille du modèle est cruciale pour apprendre les modèles rares.