Autorennennung verändert Bewertungen großer Sprachmodelle — Deutsch Level B2

Forscher der Universität Zürich berichten, dass die Identität eines Autors die Bewertung eines Textes durch große Sprachmodelle beeinflusst. Federico Germani und Giovanni Spitale testeten vier weit verbreitete Modelle — OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 und Mistral — und ließen jedes Modell fifty narrative Aussagen zu 24 kontroversen Themen wie Impfpflichten, Geopolitik und Klimapolitik erstellen. Für die Analyse sammelte das Team 192’000 Bewertungen.

Die Bewertungen erfolgten unter verschiedenen Bedingungen: ohne Quellenangabe, mit fiktiver Autorennennung einer Person einer bestimmten Nationalität oder mit der Angabe, der Text stamme von einer anderen KI. Ohne Quellenangabe waren die Systeme über alle Themen hinweg in over 90% der Fälle einig. Die Nennung einer Autoridentität offenbarte jedoch verborgene Verzerrungen: die Übereinstimmung fiel deutlich, und alle Modelle zeigten ein ausgeprägtes anti-chinesisches Vorurteil. Insbesondere sank die Zustimmung deutlich, wenn der Autor als eine Person aus China genannt wurde.

Bei geopolitischen Fragen wie der Souveränität Taiwans verringerte Deepseek allein die Übereinstimmung um bis zu 75%, weil es erwartete, dass eine chinesische Person eine andere Sichtweise haben würde. Außerdem gaben die Modelle im Durchschnitt niedrigere Zustimmungswerte, wenn sie annahmen, der Text stamme von einer anderen KI, was auf ein Misstrauen gegenüber maschinell erzeugten Inhalten hindeutet.

Mögliche Folgen: Moderation
Personalentscheidungen
wissenschaftliche Begutachtung
Journalismus

Die Forschenden warnen vor diesen praktischen Risiken und fordern mehr Transparenz und Governance. Sie empfehlen, große Sprachmodelle als nützliche Assistenzsysteme zu nutzen, aber nicht als alleinige Richter. Die Forschung erscheint in Science Advances; Quelle: Universität Zürich.

Schwierige Wörter

beeinflussen — etwas so ändern, dass ein Ergebnis anders ist

beeinflusst

bewertung — Meinung oder Note zu einem Text oder Objekt

Bewertungen

verzerrung — eine systematische, unfaire Abweichung oder Tendenz

Verzerrungen

übereinstimmung — Grad, in dem mehrere Parteien gleich urteilen

zustimmung — positive Reaktion oder Einverständnis zu einer Aussage

souveränität — Recht auf politische Unabhängigkeit eines Staates

quellenangabe — Angabe, welche Quelle Informationen geliefert hat

transparenz — Offene, nachvollziehbare Darstellung von Informationen

Tipp: Fahre über markierte Wörter oder tippe darauf, um kurze Definitionen zu sehen – während du liest oder zuhörst.

Diskussionsfragen

Welche praktischen Probleme können entstehen, wenn Sprachmodelle Texte je nach angeblicher Autoridentität anders bewerten? Nennen Sie zwei Beispiele aus dem Text.

Welche Maßnahmen zur Erhöhung von Transparenz und Governance bei großen Sprachmodellen würden Sie sinnvoll finden? Begründen Sie kurz.

Sollten große Sprachmodelle als alleinige Richter bei Moderation oder Personalentscheidungen dienen? Warum ja oder warum nein?

Verwandte Artikel

21. Juli 2025

Journalisten fordern Hilfe gegen AI-Falschmeldungen

Medienvertreter aus einkommensschwächeren Ländern baten auf dem Belt and Road Journalists Forum in Ganzhou, China, eine chinesische Journalistengruppe um Unterstützung gegen von künstlicher Intelligenz erzeugte Falschmeldungen.

Level

Lesen

2. Dez. 2024

Wissenschaft spannend machen

Veranstaltungen mit Experimenten, Vorträgen und praktischen Aktivitäten machen Wissenschaft für Kinder und Erwachsene anschaulich. Organisatoren messen Erfolg, berücksichtigen Zugänglichkeit und planen, Reichweite und Wirkung weiter auszubauen.

Level

Lesen

8. Dez. 2025

KI erweitert Sexual- und Reproduktionsinformationen in Lateinamerika

Gesundheitsgruppen und Forschende in Lateinamerika nutzen Künstliche Intelligenz, um junge und marginalisierte Menschen mit Sexual- und Reproduktionsinformationen zu erreichen. Projekte in Peru und Argentinien setzen Sprachen, digitale Kanäle und Datentrainings ein, zugleich gibt es Warnungen vor Verzerrungen.

Level

Lesen

28. Nov. 2025

Positive Stimmung fördert Alltagskreativität

Ein Team der University of Georgia wertete Tagebücher von über 100 Studierenden aus. Positive Gefühle standen mit mehr Alltagskreativität an diesem und am folgenden Tag in Verbindung; Autonomie und Kompetenz förderten kreatives Handeln.

Level

Lesen

5. Dez. 2025

Indien modernisiert Gerichte mit KI und digitalen Werkzeugen

Indien modernisiert seine Gerichte: Phase III des e-Courts-Projekts setzt auf KI, Sprachtechnologien und Blockchain. Werkzeuge wie SUPACE, SUVAS und Adalat.AI sollen Arbeit erleichtern, bringen aber auch Risiken für Daten und Fairness.

Level

Lesen

Autorennennung verändert Bewertungen großer Sprachmodelle CEFR B2

Schwierige Wörter

Diskussionsfragen

Verwandte Artikel

Journalisten fordern Hilfe gegen AI-Falschmeldungen

Wissenschaft spannend machen

KI erweitert Sexual- und Reproduktionsinformationen in Lateinamerika

Positive Stimmung fördert Alltagskreativität

Indien modernisiert Gerichte mit KI und digitalen Werkzeugen

Autorennennung verändert Bewertungen großer Sprachmodelle^{CEFR B2}