Nova esploro de University of Washington, publikigita en PLOS One, studas ĉu artefarita inteligenteco povas akiri kulturajn valorojn observante homan konduton. La teamo uzis inversan rekompencan lernadon (IRL), kie la AI ne ricevas rektan celon sed deduktas celojn kaj rekompencojn observante homajn agojn. La aŭtoroj argumentas ke ĉi tiu aliro pli proksimiĝas al la maniero kiel infanoj lernas, kiel priskribas kun-aŭtoro Andrew Meltzoff de I-LABS.
La esploristoj rekrutis plenkreskulojn kiuj identiĝis kiel white (190 personoj) kaj kiel Latino (110 personoj) kaj uzis la datumojn de ĉiu grupo por trejni apartajn AI-agentojn. En la ĉefa eksperimento partoprenantoj ludis modifitan version de la videoludo Overcooked. Ludantoj kuiris kaj liveris cepon-supon dum ili vidis en alian kuirejon kie la alia ludanto devis piediri pli longan distancon. Partoprenantoj ne sciis ke la alia ludanto foje estis roboto kiu petis helpon; homoj povis donaci cepojn sed tiel mem liverus malpli da supo.
La rezultoj montras ke homoj en la Latino-grupo helpis pli ofte kaj ke la agento trejnita per Latino-datumoj donacis pli da cepoj. En dua testo la agentoj decidis ĉu donaci parton de sia mono al iu en bezono, kaj denove la Latino-trejnita agento kondutis pli altruiste. Seniora aŭtoro Rajesh Rao atentigas ke oni ne devus hard-kodi universalan aron da valoroj en AI, ĉar diversaj kulturoj havas siajn proprajn valorojn; la esploristoj ankaŭ sugestas ke pligrandigi la kvanton kaj varion de kultur-specifaj datumoj povus permesi fajnan agordadon antaŭ povasigo. Aliaj kun-aŭtoroj estas de UW kaj San Diego State University.
Malfacilaj vortoj
- inversa rekompenca lernado — metodo kie AI deduktas celojn observante agojninversan rekompencan lernadon
- dedukti — konkludi aŭ trovi celon el observadodeduktas
- observi — vidi kaj noti la agadon de personojobservante
- trejni — instrui aŭ formi kapablojn per praktikotrejnita
- rekompenco — premio aŭ pago por certa ago aŭ kondutorekompencojn
- agordo — ŝanĝo aŭ reglado de parametroj aŭ kondutoagordadon
- povasigo — procezo por efektivigi aŭ lanĉi teknologion
Konsilo: ŝovu la musmontrilon, fokusu aŭ tuŝu la reliefigitajn vortojn en la artikolo por vidi rapidajn difinojn dum legado aŭ aŭskultado.
Diskutaj demandoj
- Ĉu laŭ vi estas taŭge trejni AI per datumoj de specifaj kulturaj grupoj? Kial aŭ kial ne?
- Kiaj eblaj problemoj aŭ avantaĝoj povas aperi se AI lernas valorojn nur de unu kultura grupo?
- Kion signifas «fajna agordado antaŭ povasigo» kaj kiel tio povus ŝanĝi la uzadon de AI en realaj situacioj?