Warum Sprachmodelle bei vierstelliger Multiplikation scheitern — Deutsch Level B1

Ein internationales Forscherteam unter Leitung von Xiaoyan Bai und Chenhao Tan an der University of Chicago, zusammen mit Mitarbeitenden vom MIT, der Harvard University, der University of Waterloo und Google DeepMind, untersuchte, warum Large Language Models bei der Multiplikation zweier vierstelliger Zahlen scheitern. Im Fokus stand der Umgang mit langen Abhängigkeiten: Modelle müssen Teilprodukte und laufende Summen behalten, um das korrekte Endergebnis zu bilden.

Beim Standard-Fine-Tuning erzielten Modelle mit zwei bis zwölf Schichten weniger als 1% Genauigkeit. Die Forschenden fanden, dass diese Modelle lokale Muster lernen, aber keinen Mechanismus zur Speicherung von Zwischenwerten entwickeln. Das ICoT-trainierte Modell erreichte dagegen 100% Genauigkeit und kodierte Zwischenwerte in seinen verborgenen Zuständen, sodass laufende Summen dekodiert werden konnten.

Die Analyse zeigte ebenfalls, dass frühe Schichten Produktpaare an bestimmten Orten speichern und spätere Schichten diese Werte abrufen. Beobachtet wurden zudem Fourier-ähnliche Darstellungen von Ziffern und eine geometrische Operation ähnlich einer Minkowski-Summe. Insgesamt deuten die Ergebnisse darauf hin, dass gezielte Architekturänderungen und Trainingsziele mehrstufiges Rechnen ermöglichen.

Schwierige Wörter

abhängigkeit — Beziehung zwischen Teilen, die voneinander abhängen

Abhängigkeiten

teilprodukt — Teil eines Ergebnisses bei einer Rechenaufgabe

Teilprodukte

zwischenwert — Zwischenergebnis oder Zahl während einer Berechnung

Zwischenwerten, Zwischenwerte

genauigkeit — Maß dafür, wie richtig ein Ergebnis ist

schicht — Eine Ebene oder Lage im Modellaufbau

Schichten

darstellung — Art, wie Informationen sichtbar oder mathematisch gezeigt werden

Darstellungen

Tipp: Fahre über markierte Wörter oder tippe darauf, um kurze Definitionen zu sehen – während du liest oder zuhörst.

Diskussionsfragen

Warum ist es wichtig, dass Modelle Zwischenwerte während einer Rechnung speichern können?

Welche Architektur- oder Trainingsänderungen könnten nach diesem Text helfen, mehrstufiges Rechnen zu ermöglichen?

Haben Sie im Matheunterricht Verfahren gelernt, die in mehrere Schritte geteilt sind? Beschreiben Sie kurz eines.

Verwandte Artikel

31. Juli 2025

Wenige reiche Länder prägen Forschung in der Tropenmedizin

Eine Analyse zeigt, dass Redaktionsgremien der Tropenmedizin überwiegend aus wohlhabenden Ländern stammen. Betroffene Regionen sind oft unterrepräsentiert; die Studie verknüpft dies mit Finanzierungsungleichheiten und empfiehlt mehr Diversität und Partnerschaften.

Level

Lesen

10. Nov. 2025

Soziale Medien: Nutzen, Risiken und neue KI-Gefahren

Soziale Medien verbinden Menschen, helfen marginalisierten Gruppen, verbreiten aber auch Hass, Lügen und reale Schäden. Entscheidungen von Firmen, Algorithmen und generative KI verändern Sichtbarkeit, Vertrauen und Risiko in der Öffentlichkeit.

Level

Lesen

29. Dez. 2025

Studie: PHQ-Fragen führen zu Missverständnissen

Eine Studie in JAMA Psychiatry zeigt, dass Patientinnen und Patienten das PHQ unterschiedlich verstehen. Die Autoren empfehlen, Häufigkeit und Belastung eines Symptoms getrennt zu fragen, und schlagen dafür einfache Formulierungen vor.

Level

Lesen

24. Feb. 2026

Molekül speichert Sonnenlicht als Wärme

Forscher an der UC Santa Barbara entwickelten ein modifiziertes Molekül, das Sonnenlicht in chemischen Bindungen speichert und bei Bedarf als Wärme freisetzt. Experimente erzeugten genügend Wärme, um Wasser zum Kochen zu bringen; die Entwicklung wird weiter gefördert.

Level

Lesen

9. Jan. 2026

Ernteverluste in Indien durch Klima, Schädlinge und Kontamination

Ernteverluste in Indien steigen wegen Wetterextremen, Schädlingen, Bodenverschlechterung und Verschmutzung. Verrottetes Getreide, Pilzgifte und fehlende Lagerung gefährden Ertrag, Einkommen und Gesundheit.

Level

Lesen

Warum Sprachmodelle bei vierstelliger Multiplikation scheitern CEFR B1

Schwierige Wörter

Diskussionsfragen

Verwandte Artikel

Wenige reiche Länder prägen Forschung in der Tropenmedizin

Soziale Medien: Nutzen, Risiken und neue KI-Gefahren

Studie: PHQ-Fragen führen zu Missverständnissen

Molekül speichert Sonnenlicht als Wärme

Ernteverluste in Indien durch Klima, Schädlinge und Kontamination

Warum Sprachmodelle bei vierstelliger Multiplikation scheitern^{CEFR B1}