LingVo.club
Niveau
Pourquoi les modèles ratent la multiplication à quatre chiffres — Niveau B1 — brown wooden blocks on white surface

Pourquoi les modèles ratent la multiplication à quatre chiffresCEFR B1

29 déc. 2025

Niveau B1 – Intermédiaire
3 min
165 mots

Une équipe dirigée par Xiaoyan Bai et Chenhao Tan, avec des collaborateurs d'autres universités, a étudié pourquoi des modèles de langage ont du mal à multiplier deux nombres à quatre chiffres. Les chercheurs ont comparé l'affinage standard à une méthode appelée Implicit Chain of Thought (ICoT). Sous l'affinage standard, des modèles de 2 à 12 couches ont obtenu une précision inférieure à 1 % pour cette tâche.

En revanche, le modèle entraîné avec ICoT a atteint 100 %. Les chercheurs ont sondé les états internes et montré que ICoT encode les valeurs intermédiaires : on peut décoder les sommes courantes à partir des états cachés, ce qui prouve que le modèle mémorise l'information utile.

Ils ont aussi ajouté un objectif d'entraînement simple pour suivre les sommes courantes. Appliqué à un modèle à deux couches, cet objectif a porté la précision à 99 % sans supervision explicite par chaîne de pensée. Les auteurs soulignent que l'orientation architecturale et les objectifs d'entraînement ciblés peuvent permettre d'acquérir un raisonnement en plusieurs étapes.

Mots difficiles

  • affinageaction d'ajuster un modèle par entraînement
    l'affinage
  • encodertransformer une information en représentation interne
    encode
  • étatcondition interne d'un modèle à un moment donné
    états internes, états cachés
  • précisionmesure du pourcentage de réponses correctes
  • supervisioncontrôle humain ou donnée correcte pour l'entraînement
    supervision explicite
  • objectifbut fixé pendant l'entraînement d'un modèle
    objectif d'entraînement, objectifs d'entraînement
  • raisonnementprocessus de pensée pour résoudre des étapes

Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.

Questions de discussion

  • Pensez-vous que rendre visibles les étapes intermédiaires aiderait les humains à comprendre les modèles ? Pourquoi ?
  • Comment l'orientation architecturale peut-elle, selon vous, favoriser un raisonnement en plusieurs étapes ? Donnez une raison simple.
  • Donnez un exemple d'une autre tâche où ajouter un objectif d'entraînement simple pourrait améliorer la précision.

Articles liés

Pourquoi les modèles ratent la multiplication à quatre chiffres — Français Niveau B1 | LingVo.club