Pourquoi les modèles ratent la multiplication à quatre chiffres
Une étude montre que l'entraînement standard empêche certains modèles de langage de garder les valeurs intermédiaires nécessaires pour multiplier deux nombres à quatre chiffres. Une méthode appelée ICoT permet au modèle d'atteindre 100 % et de mémoriser ces étapes.