LingVo.club
Nivelo
AI lernas kulturajn valorojn observante homojn — Nivelo B2 — person holding green paper

AI lernas kulturajn valorojn observante homojnCEFR B2

15 Dec 2025

Nivelo B2 – Supra meza nivelo
5 min
255 vortoj

Nova esploro de University of Washington, publikigita en PLOS One, studas ĉu artefarita inteligenteco povas akiri kulturajn valorojn observante homan konduton. La teamo uzis inversan rekompencan lernadon (IRL), kie la AI ne ricevas rektan celon sed deduktas celojn kaj rekompencojn observante homajn agojn. La aŭtoroj argumentas ke ĉi tiu aliro pli proksimiĝas al la maniero kiel infanoj lernas, kiel priskribas kun-aŭtoro Andrew Meltzoff de I-LABS.

La esploristoj rekrutis plenkreskulojn kiuj identiĝis kiel white (190 personoj) kaj kiel Latino (110 personoj) kaj uzis la datumojn de ĉiu grupo por trejni apartajn AI-agentojn. En la ĉefa eksperimento partoprenantoj ludis modifitan version de la videoludo Overcooked. Ludantoj kuiris kaj liveris cepon-supon dum ili vidis en alian kuirejon kie la alia ludanto devis piediri pli longan distancon. Partoprenantoj ne sciis ke la alia ludanto foje estis roboto kiu petis helpon; homoj povis donaci cepojn sed tiel mem liverus malpli da supo.

La rezultoj montras ke homoj en la Latino-grupo helpis pli ofte kaj ke la agento trejnita per Latino-datumoj donacis pli da cepoj. En dua testo la agentoj decidis ĉu donaci parton de sia mono al iu en bezono, kaj denove la Latino-trejnita agento kondutis pli altruiste. Seniora aŭtoro Rajesh Rao atentigas ke oni ne devus hard-kodi universalan aron da valoroj en AI, ĉar diversaj kulturoj havas siajn proprajn valorojn; la esploristoj ankaŭ sugestas ke pligrandigi la kvanton kaj varion de kultur-specifaj datumoj povus permesi fajnan agordadon antaŭ povasigo. Aliaj kun-aŭtoroj estas de UW kaj San Diego State University.

Malfacilaj vortoj

  • inversa rekompenca lernadometodo kie AI deduktas celojn observante agojn
    inversan rekompencan lernadon
  • deduktikonkludi aŭ trovi celon el observado
    deduktas
  • observividi kaj noti la agadon de personoj
    observante
  • trejniinstrui aŭ formi kapablojn per praktiko
    trejnita
  • rekompencopremio aŭ pago por certa ago aŭ konduto
    rekompencojn
  • agordoŝanĝo aŭ reglado de parametroj aŭ konduto
    agordadon
  • povasigoprocezo por efektivigi aŭ lanĉi teknologion

Konsilo: ŝovu la musmontrilon, fokusu aŭ tuŝu la reliefigitajn vortojn en la artikolo por vidi rapidajn difinojn dum legado aŭ aŭskultado.

Diskutaj demandoj

  • Ĉu laŭ vi estas taŭge trejni AI per datumoj de specifaj kulturaj grupoj? Kial aŭ kial ne?
  • Kiaj eblaj problemoj aŭ avantaĝoj povas aperi se AI lernas valorojn nur de unu kultura grupo?
  • Kion signifas «fajna agordado antaŭ povasigo» kaj kiel tio povus ŝanĝi la uzadon de AI en realaj situacioj?

Rilataj artikoloj