LingVo.club
📖+30 XP
🎧+20 XP
+35 XP
Pourquoi les modèles ratent la multiplication à quatre chiffres — Niveau B1 — brown wooden blocks on white surface

Pourquoi les modèles ratent la multiplication à quatre chiffresCEFR B1

29 déc. 2025

Niveau B1 – Intermédiaire
3 min
165 mots

Une équipe dirigée par Xiaoyan Bai et Chenhao Tan, avec des collaborateurs d'autres universités, a étudié pourquoi des modèles de langage ont du mal à multiplier deux nombres à quatre chiffres. Les chercheurs ont comparé l'affinage standard à une méthode appelée Implicit Chain of Thought (ICoT). Sous l'affinage standard, des modèles de 2 à 12 couches ont obtenu une précision inférieure à 1 % pour cette tâche.

En revanche, le modèle entraîné avec ICoT a atteint 100 %. Les chercheurs ont sondé les états internes et montré que ICoT encode les valeurs intermédiaires : on peut décoder les sommes courantes à partir des états cachés, ce qui prouve que le modèle mémorise l'information utile.

Ils ont aussi ajouté un objectif d'entraînement simple pour suivre les sommes courantes. Appliqué à un modèle à deux couches, cet objectif a porté la précision à 99 % sans supervision explicite par chaîne de pensée. Les auteurs soulignent que l'orientation architecturale et les objectifs d'entraînement ciblés peuvent permettre d'acquérir un raisonnement en plusieurs étapes.

Mots difficiles

  • affinageaction d'ajuster un modèle par entraînement
    l'affinage
  • encodertransformer une information en représentation interne
    encode
  • étatcondition interne d'un modèle à un moment donné
    états internes, états cachés
  • précisionmesure du pourcentage de réponses correctes
  • supervisioncontrôle humain ou donnée correcte pour l'entraînement
    supervision explicite
  • objectifbut fixé pendant l'entraînement d'un modèle
    objectif d'entraînement, objectifs d'entraînement
  • raisonnementprocessus de pensée pour résoudre des étapes

Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.

Questions de discussion

  • Pensez-vous que rendre visibles les étapes intermédiaires aiderait les humains à comprendre les modèles ? Pourquoi ?
  • Comment l'orientation architecturale peut-elle, selon vous, favoriser un raisonnement en plusieurs étapes ? Donnez une raison simple.
  • Donnez un exemple d'une autre tâche où ajouter un objectif d'entraînement simple pourrait améliorer la précision.

Articles liés

Comment rendre les modèles de langage plus sûrs — Niveau B1
26 mars 2026

Comment rendre les modèles de langage plus sûrs

Des chercheurs de North Carolina State University étudient l’alignement de sécurité des grands modèles de langage. Ils identifient un problème d’alignement superficiel et proposent de « geler » des neurones clés pour réduire les mauvaises réponses tout en conservant la performance.