Onderzoekers van de University of Washington tonen aan dat AI-systemen culturele waarden kunnen oppikken door menselijk gedrag te observeren. De resultaten zijn gepubliceerd in PLOS One. De studie bouwt voort op eerder werk dat liet zien dat opvoeding en cultuur verschillen in altruïsme kunnen veroorzaken. Voor de AI-experimenten leverden 190 volwassenen die zich als wit identificeerden en 110 die zich als Latino identificeerden de trainingsdata; voor elk van deze groepen werd een aparte agent getraind.
In plaats van traditionele reinforcement learning gebruikten de auteurs inverse reinforcement learning (IRL). Waar standaard reinforcement learning werkt met expliciete doelen en beloningen, probeert IRL de onderliggende doelen en beloningen af te leiden uit zichtbaar menselijk gedrag. De auteurs stellen dat deze methode dichter bij menselijke leerprocessen ligt, zoals ouders die algemeen wenselijk gedrag tonen in plaats van concrete taken.
De proef gebruikte een aangepaste versie van het spel Overcooked. Deelnemers maakten soep en konden uien weggeven aan een tweede speler die om hulp vroeg, zonder te weten dat die speler een bot was. Mensen uit de Latino-groep hielpen vaker, en de agent getraind op Latino-data gaf in het spel significant meer uien weg. In een vervolgtest droeg diezelfde agent ook vaker geld aan iemand in nood.
Senior auteur Rajesh Rao waarschuwt tegen het hardcoderen van één universele set waarden, omdat culturen eigen waarden hebben. Hij zegt dat de demonstraties mogelijk opschalen als ontwikkelaars meer en gevarieerdere culturespecifieke data gebruiken, waardoor fijnslijpen voor inzet mogelijk wordt. Andrew Meltzoff vraagt hoe we systemen maken die de perspectieven van anderen meewegen en burgerzin tonen. Extra coauteurs komen van UW en San Diego State University.
Moeilijke woorden
- inverse reinforcement learning — methode om doelen uit gedrag af te leidenIRL
- reinforcement learning — leerproces met expliciete doelen en beloningen
- altruïsme — handelen met aandacht voor welzijn van anderen
- agent — software die acties in een omgeving uitvoert
- hardcoderen — vast programmeren van regels in een systeem
- weggeven — iets aan iemand geven zonder betaling
- perspectief — manier waarop iemand naar iets kijktperspectieven
Tip: beweeg de muisaanwijzer over gemarkeerde woorden in het artikel, of tik erop om snelle definities te zien terwijl je leest of luistert.
Discussievragen
- Hoe zou het gebruik van culturespecifieke data AI-toepassingen in jouw omgeving kunnen beïnvloeden? Geef voorbeelden.
- Welke mogelijke voordelen en risico's zie je bij het trainen van AI met data van verschillende culturele groepen?
- Hoe zouden ontwikkelaars systemen kunnen ontwerpen die de perspectieven van anderen meenemen, zoals in de tekst besproken?
Gerelateerde artikelen
Videospel helpt kinderen oefenen met wetenschap
Onderzoekers ontwikkelden het spel Virtual Vet om basisschoolleerlingen te laten oefenen met wetenschappelijke vaardigheden en redeneerwerk. In tests behaalden kinderen die het spel speelden gemiddeld hogere scores dan bij traditionele klassikale activiteiten.
Festival voor pigeon peas in Diego Martin
In Diego Martin startte Florence Warrick-Joseph een festival voor de peulvrucht pigeon peas. Het eerste festival was in 2015 en buurtbewoners deelden recepten. Er ontstonden nieuwe gerechten, een receptenboek en plannen voor verkoop van producten.
Discussie over beoordelingssysteem in kendo
Kendo-punten komen van menselijke scheidsrechters die letten op ki-ken-tai no icchi: eenheid van geest, zwaard en lichaam. Er zijn klachten over inconsistentie, discussie over technologie en oproepen voor duidelijkere regels en betere basisvaardigheden.