Eine Forschungsgruppe der University of Washington untersucht, ob KI kulturelle Werte ähnlich wie Menschen aus Beobachtung lernen kann. Die Studie greift frühere Ergebnisse auf, wonach 19 Monate alte Kinder aus Latino- und asiatischen Haushalten tendenziell altruistischer waren. Für die aktuelle Arbeit rekrutierten die Forschenden zwei Erwachsenengruppen und nutzten die Verhaltensdaten jeder Gruppe, um jeweils einen separaten KI-Agenten zu trainieren.
Die Agenten lernten mittels inverse reinforcement learning (IRL). Im Unterschied zum klassischen reinforcement learning, bei dem Ziele und Belohnungen vorgegeben sind, schlussfolgert IRL die zugrunde liegenden Ziele aus beobachtetem menschlichem Verhalten. Im Hauptexperiment spielten die Teilnehmer eine veränderte Version des Videospiels Overcooked: Sie kochten und lieferten Zwiebelsuppe und konnten in eine andere Küche sehen, wo ein zweiter Spieler um Hilfe bat. Spielern war nicht bewusst, dass dieser zweite Spieler ein Bot war. Menschen konnten Zwiebeln verschenken, halfen dadurch aber selbst weniger bei den Lieferungen.
Die Forschenden beobachteten, dass die Latino-Gruppe insgesamt häufiger half. Entsprechend zeigte der mit Latino-Daten trainierte Agent mehr altruistisches Verhalten, etwa öfter Zwiebeln zu verschenken und eher einen Teil seines Geldes an Bedürftige zu spenden. Seniorautor Rajesh Rao warnt davor, universelle Werte in KI fest einprogrammieren zu wollen, weil Kulturen unterschiedliche Werte haben. Er schlägt vor, Demonstrationen und kulturbezogene Datenmengen zu vergrößern, um Feineinstellungen vor dem Einsatz zu ermöglichen. Die Autorinnen und Autoren betonen, dass weitere Forschung nötig ist, um mehr Kulturen, konkurrierende Werte und reale Probleme zu testen.
Die Ergebnisse wurden in PLOS One veröffentlicht. Weitere Koautorinnen und Koautoren stammen von der UW und der San Diego State University. Quelle: University of Washington.
Schwierige Wörter
- wert — etwas, das Menschen wichtig oder bedeutsam findenkulturelle Werte
- altruistisch — anderen freiwillig helfen ohne Gegenleistungaltruistischer
- rekrutieren — Personen für eine Studie anwerben und aufnehmenrekrutierten
- trainieren — etwas durch Übung oder Daten verbessern
- belohnung — positiver Effekt oder Vorteil nach einem VerhaltenBelohnungen
- schlussfolgern — aus Hinweisen eine Schlussfolgerung ziehenschlussfolgert
- feineinstellung — kleine Änderung zur Verbesserung oder AnpassungFeineinstellungen
- demonstration — gezeigtes Beispiel von Verhalten zum LernenDemonstrationen
Tipp: Fahre über markierte Wörter oder tippe darauf, um kurze Definitionen zu sehen – während du liest oder zuhörst.
Diskussionsfragen
- Welche Vor- und Nachteile sehen Sie darin, wenn KI kulturelle Werte aus Beobachtung lernt?
- Wie könnte man die beschriebene Studie erweitern, um mehr Kulturen und reale Probleme zu testen?
- Welche ethischen Probleme könnten entstehen, wenn KI vor allem mit Daten aus einer Kultur trainiert wird?
Verwandte Artikel
Rezession 2008 veränderte Klassenidentität in den USA
Neue Forschung zeigt: Die Rezession 2008 brachte viele Amerikaner dazu, sich einer niedrigeren sozialen Klasse zuzuordnen. Eine Studie, geleitet von Stephen Antonoplis, nutzte vier Datensätze mit rund 165.000 Menschen über Jahrzehnte.
Stress an den Feiertagen: einfache Tipps
Die Feiertage können wegen familiärer Erwartungen, politischen Streitigkeiten und zusätzlicher Ausgaben sehr stressig sein. Psychologe Jason Moser empfiehlt kurze Reflexionen und das Ersetzen unwirksamer Bewältigungsstrategien durch einfachere, realistische Ansätze.