Une équipe dirigée par Xiaoyan Bai et Chenhao Tan, avec des collaborateurs d'autres universités, a étudié pourquoi des modèles de langage ont du mal à multiplier deux nombres à quatre chiffres. Les chercheurs ont comparé l'affinage standard à une méthode appelée Implicit Chain of Thought (ICoT). Sous l'affinage standard, des modèles de 2 à 12 couches ont obtenu une précision inférieure à 1 % pour cette tâche.
En revanche, le modèle entraîné avec ICoT a atteint 100 %. Les chercheurs ont sondé les états internes et montré que ICoT encode les valeurs intermédiaires : on peut décoder les sommes courantes à partir des états cachés, ce qui prouve que le modèle mémorise l'information utile.
Ils ont aussi ajouté un objectif d'entraînement simple pour suivre les sommes courantes. Appliqué à un modèle à deux couches, cet objectif a porté la précision à 99 % sans supervision explicite par chaîne de pensée. Les auteurs soulignent que l'orientation architecturale et les objectifs d'entraînement ciblés peuvent permettre d'acquérir un raisonnement en plusieurs étapes.
Mots difficiles
- affinage — action d'ajuster un modèle par entraînementl'affinage
- encoder — transformer une information en représentation interneencode
- état — condition interne d'un modèle à un moment donnéétats internes, états cachés
- précision — mesure du pourcentage de réponses correctes
- supervision — contrôle humain ou donnée correcte pour l'entraînementsupervision explicite
- objectif — but fixé pendant l'entraînement d'un modèleobjectif d'entraînement, objectifs d'entraînement
- raisonnement — processus de pensée pour résoudre des étapes
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Pensez-vous que rendre visibles les étapes intermédiaires aiderait les humains à comprendre les modèles ? Pourquoi ?
- Comment l'orientation architecturale peut-elle, selon vous, favoriser un raisonnement en plusieurs étapes ? Donnez une raison simple.
- Donnez un exemple d'une autre tâche où ajouter un objectif d'entraînement simple pourrait améliorer la précision.
Articles liés
La grossesse comporte un risque de décès beaucoup plus élevé que l'avortement
Une nouvelle analyse utilisant des données récentes (2018–2021) montre que le risque de décès lié à la grossesse est nettement supérieur à celui lié à l'avortement. Les auteurs appellent à réduire la mortalité maternelle.
Bactery : une batterie qui utilise des bactéries du sol
Une start-up d'une université britannique a créé Bactery, une batterie qui utilise des bactéries du sol pour produire de l'énergie et recharger. Le prototype a été testé au Brésil et la production à petite échelle est visée en 2026.
Un test rapide du paludisme jugé non adapté en Asie du Sud-Est
Une étude publiée dans Malaria Journal affirme que le test Abbott-Bioline donne de nombreux faux négatifs. L’étude, conduite à la frontière Thaïlande–Myanmar (octobre 2024–janvier 2025), a obtenu des réactions d’Abbott et de l’OMS.