Wissenschaftler der Brown University untersuchten, ob moderne Sprachmodelle eine Art Verständnis der realen Welt besitzen. Die Arbeit wurde auf der International Conference on Learning Representations in Rio de Janeiro vorgestellt.
Die Forschenden präsentierten Sätze mit unterschiedlich plausiblen Ereignissen, etwa „Jemand kühlte ein Getränk mit Eis“, „mit Schnee“, „mit Feuer“ oder „mit gestern“. Für jeden Satz analysierten sie die internen mathematischen Zustände, eine Methode, die mechanistische Interpretierbarkeit genannt wird.
Die Experimente liefen über mehrere Open‑Source‑Modelle, darunter GPT‑2, Llama 3.2 und Gemma 2. Die Studie zeigte, dass genügend große Modelle interne Vektoren entwickelten, die zu Plausibilitätskategorien passten. Diese Vektoren konnten ähnliche Kategorien, etwa unwahrscheinlich gegenüber unmöglich, mit etwa 85% Genauigkeit unterscheiden und spiegelten auch gespaltene menschliche Urteile wider.
Schwierige Wörter
- sprachmodell — Computerprogramm, das Sprache versteht oder erzeugtSprachmodelle
- verständnis — Wissen oder Einsicht über die reale Welt
- interpretierbarkeit — Möglichkeit, wie ein Modell erklärt werden kannmechanistische Interpretierbarkeit
- intern — innerhalb eines Systems oder Modellsinternen
- vektor — Mathematische Liste von Zahlen im ModellVektoren
- plausibilitätskategorie — Gruppe für mögliche oder unmögliche EreignissePlausibilitätskategorien
- genauigkeit — Wie oft ein Ergebnis richtig ist
Tipp: Fahre über markierte Wörter oder tippe darauf, um kurze Definitionen zu sehen – während du liest oder zuhörst.
Diskussionsfragen
- Glaubst du, dass die Ergebnisse zeigen, dass Sprachmodelle echtes Verständnis haben? Warum oder warum nicht?
- Was könnte es bedeuten, wenn die Vektoren gespaltene menschliche Urteile widerspiegeln?
- Wie würdest du praktisch prüfen, ob ein Sprachmodell die reale Welt versteht? Nenne eine einfache Idee.
Verwandte Artikel
Wie Stress und Cortisol emotionale Erinnerungen stärken
Eine Studie von Forschenden an Yale zeigt: Das Hormon Cortisol verändert Gehirnnetzwerke und hilft, emotionale Erlebnisse besser ins Langzeitgedächtnis zu speichern. Teilnehmende sahen Bilder, nahmen Hydrocortison oder Placebo und wurden im fMRI gescannt.
Citizen Science stärkt Überwachung von Gesundheit und Umwelt
Eine im August in Frontiers in Public Health veröffentlichte Übersichtsarbeit zeigt: Citizen Science kann viele Gesundheits‑ und Wohlbefindensindikatoren der SDGs und der WHO‑Triple‑Billion‑Ziele besser überwachen. Autorinnen und Autoren kommen von IIASA und WHO.
Dopamin stärkt motorisches Lernen im Schlaf
Eine Studie zeigt, dass bestimmte Dopaminneuronen kurz nach dem Erlernen neuer Bewegungen im Non‑REM‑Schlaf aktiv werden. Die synchronisierte Aktivität mit Schlafspindeln stärkt motorische Erinnerungen und verbessert die Leistung nach dem Schlaf.
Wissenschaftsjournalismus in der Pandemie
Ein globaler Bericht untersucht, wie die COVID-19-Pandemie die Arbeit von Wissenschaftsjournalistinnen und -journalisten veränderte. Befragt wurden Journalistinnen und Journalisten aus vielen Ländern; die Arbeit wurde intensiver und Preprints wurden häufiger genutzt.
Harze und Weinreste in Pompeji zeigen weiten Handel
Forscher analysierten Aschereste aus zwei Räuchergefäßen aus Pompeji und einer nahegelegenen Villa. Sie fanden regionale Pflanzen, ein exotisches Baumharz aus tropischen Regionen und ein Traubenprodukt, das auf rituellen Weingebrauch hinweist.