Pourquoi les modèles ratent la multiplication à quatre chiffres (Français, Niveau B1)

Une équipe dirigée par Xiaoyan Bai et Chenhao Tan, avec des collaborateurs d'autres universités, a étudié pourquoi des modèles de langage ont du mal à multiplier deux nombres à quatre chiffres. Les chercheurs ont comparé l'affinage standard à une méthode appelée Implicit Chain of Thought (ICoT). Sous l'affinage standard, des modèles de 2 à 12 couches ont obtenu une précision inférieure à 1 % pour cette tâche.

En revanche, le modèle entraîné avec ICoT a atteint 100 %. Les chercheurs ont sondé les états internes et montré que ICoT encode les valeurs intermédiaires : on peut décoder les sommes courantes à partir des états cachés, ce qui prouve que le modèle mémorise l'information utile.

Ils ont aussi ajouté un objectif d'entraînement simple pour suivre les sommes courantes. Appliqué à un modèle à deux couches, cet objectif a porté la précision à 99 % sans supervision explicite par chaîne de pensée. Les auteurs soulignent que l'orientation architecturale et les objectifs d'entraînement ciblés peuvent permettre d'acquérir un raisonnement en plusieurs étapes.

Mots difficiles

affinage — action d'ajuster un modèle par entraînement

l'affinage

encoder — transformer une information en représentation interne

encode

état — condition interne d'un modèle à un moment donné

états internes, états cachés

précision — mesure du pourcentage de réponses correctes

supervision — contrôle humain ou donnée correcte pour l'entraînement

supervision explicite

objectif — but fixé pendant l'entraînement d'un modèle

objectif d'entraînement, objectifs d'entraînement

raisonnement — processus de pensée pour résoudre des étapes

Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.

Questions de discussion

Pensez-vous que rendre visibles les étapes intermédiaires aiderait les humains à comprendre les modèles ? Pourquoi ?

Comment l'orientation architecturale peut-elle, selon vous, favoriser un raisonnement en plusieurs étapes ? Donnez une raison simple.

Donnez un exemple d'une autre tâche où ajouter un objectif d'entraînement simple pourrait améliorer la précision.

Patch biodégradable pour aider le cœur après une crise cardiaque

Des chercheurs présentent un patch biodégradable avec des micro-aiguilles qui délivrent l’interleukine-4 directement sur le cœur blessé. Le traitement favorise la réparation locale, limite les effets dans le reste du corps et nécessite une chirurgie pour l’instant.

Niveau

Lire

24 avr. 2026

« Vibe coding » : l'IA et le code vulnérable

Des chercheurs alertent sur le « vibe coding », un style de programmation où des outils d'IA produisent du code non sécurisé. Un radar développé par Georgia Tech détecte et suit ces vulnérabilités pour mieux les comprendre et les prévenir.

Niveau

Lire

24 déc. 2025

Un matériau qui utilise la lumière pour éliminer les polluants de l'eau

Des chercheurs ont créé un matériau qui, exposé à la lumière, décompose plusieurs polluants de l'eau, y compris les PFAS. Le dispositif combine des réseaux organiques covalents avec un film de nitrure de bore et fonctionne sans métaux.

Niveau

Lire

5 juil. 2025

SEWA : un système satellitaire d'alerte précoce pour l'Afrique

Un nouveau système d'alerte par satellite, SEWA, a été lancé lors d'un forum à Windhoek (23–27 juin). SEWA vise à renforcer les alertes multi-risques et à améliorer l'accès aux données pour gouvernements, organisations et communautés.

Niveau

Lire

9 déc. 2025

Une main prothétique utilise l'IA pour mieux saisir

Des chercheurs de l'Université de l'Utah ont ajouté des capteurs et une IA à une prothèse TASKA. Le système améliore la prise, la précision et réduit l'effort, selon une étude publiée dans Nature Communications.

Niveau

Lire

Pourquoi les modèles ratent la multiplication à quatre chiffres^{CEFR B1}

Mots difficiles

Questions de discussion

Articles liés

Patch biodégradable pour aider le cœur après une crise cardiaque

« Vibe coding » : l'IA et le code vulnérable

Un matériau qui utilise la lumière pour éliminer les polluants de l'eau

SEWA : un système satellitaire d'alerte précoce pour l'Afrique

Une main prothétique utilise l'IA pour mieux saisir

Pourquoi les modèles ratent la multiplication à quatre chiffres CEFR B1

Mots difficiles

Questions de discussion

Articles liés

Patch biodégradable pour aider le cœur après une crise cardiaque

« Vibe coding » : l'IA et le code vulnérable

Un matériau qui utilise la lumière pour éliminer les polluants de l'eau

SEWA : un système satellitaire d'alerte précoce pour l'Afrique

Une main prothétique utilise l'IA pour mieux saisir

Pourquoi les modèles ratent la multiplication à quatre chiffres^{CEFR B1}