Des modèles de langage distinguent la plausibilité des événements
Des chercheurs de Brown University ont testé si des modèles de langage reconnaissent des événements plausibles, improbables, impossibles ou sans sens. Ils ont utilisé l'interprétabilité mécanistique et trouvé des vecteurs internes qui reflètent les jugements humains.