Investigadores de la University of Washington analizaron si los sistemas de inteligencia artificial pueden aprender valores culturales observando el comportamiento humano, imitando así el modo en que los niños adquieren normas sociales. El trabajo, publicado en PLOS One, usó datos de 190 adultos que se identificaron como blancos y 110 que se identificaron como latinos; cada conjunto de datos sirvió para entrenar a un agente independiente.
Los agentes se formaron mediante aprendizaje por refuerzo inverso (IRL). A diferencia del aprendizaje por refuerzo estándar, en IRL la IA no recibe un objetivo explícito, sino que observa el comportamiento humano e infiere las metas y las recompensas que lo explican. Los autores comparan este enfoque con la forma en que los padres modelan comportamientos para sus hijos, según Andrew Meltzoff, coautor y profesor en I-LABS.
En la prueba principal, los participantes jugaron una versión modificada del videojuego Overcooked. Podían regalar cebollas para ayudar a un segundo jugador que debía caminar más; los participantes ignoraban que ese segundo era un bot. El grupo latino mostró más conducta altruista y el agente entrenado con datos latinos replicó esa tendencia. En una segunda prueba de donaciones, el agente latino volvió a actuar con mayor altruismo.
El autor principal Rajesh Rao y sus colegas sostienen que no conviene imponer un conjunto único de valores a la IA; proponen ampliar la variedad de datos culturales para ajustar los sistemas antes de su despliegue y piden más investigaciones sobre otros grupos, valores en conflicto y problemas reales. Entre los investigadores hay también afiliados a San Diego State University.
Palabras difíciles
- inteligencia artificial — sistemas que realizan tareas por procesos automatizados
- aprendizaje por refuerzo inverso — método donde la IA infiere metas desde acciones
- agente — entidad que actúa en un entorno simuladoagentes
- altruismo — comportamiento que beneficia a otras personas
- recompensa — beneficio o premio que motiva una acciónrecompensas
- despliegue — puesta en funcionamiento o uso público
- imponer — forzar a aceptar una regla o idea
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o escuchas.
Preguntas de discusión
- ¿Qué riesgos y beneficios ves en entrenar sistemas de IA usando datos de un solo grupo cultural? Da ejemplos.
- ¿Qué estrategias propondrías para ampliar la variedad de datos culturales antes del despliegue de una IA?
- ¿Crees que una IA debería adaptar sus valores según la cultura local? ¿Por qué sí o por qué no?