Uma pesquisa da University of Washington publicada em PLOS One examinou se agentes de inteligência artificial podem aprender valores específicos de uma cultura observando comportamento humano. Os autores partiram de estudos anteriores sobre diferenças culturais no altruísmo em crianças e recrutaram adultos que se identificaram como brancos e como latinos; os dados de cada grupo serviram para treinar agentes distintos.
Os agentes foram treinados com aprendizado por reforço inverso (IRL), uma técnica em que a IA observa ações humanas e infere os objetivos e recompensas que motivam essas ações, em vez de receber uma recompensa explícita. Os pesquisadores dizem que esse processo se aproxima de como crianças aprendem com modelos sociais; como observa o coautor Andrew Meltzoff, os pais modelam comportamentos em vez de treinar tarefas repetidas.
No teste principal, os participantes jogaram uma versão modificada do videogame Overcooked. Era possível doar cebolas para ajudar um segundo jogador que precisava caminhar mais, mas doar reduziria as entregas do doador. Em geral, o grupo latino ajudou mais que o grupo branco, e o agente treinado com dados latinos doou mais cebolas e também foi mais generoso em um segundo teste de doação de dinheiro.
O autor sênior Rajesh Rao ressalta que não se deve codificar rigidamente um conjunto universal de valores, porque muitas culturas têm valores próprios. Os autores sugerem que desenvolvedores podem aumentar e diversificar demonstrações específicas de cada cultura para ajustar finamente sistemas antes do uso. Pesquisa adicional é necessária para testar outros grupos culturais, valores concorrentes e problemas do mundo real. Coautores adicionais vêm da UW e da San Diego State University.
Palavras difíceis
- altruísmo — comportamento que beneficia outras pessoas
- inferir — tirar conclusão a partir de dados ou açõesinfere
- recrutar — convidar ou selecionar pessoas para participarrecrutaram
- doar — dar algo a outra pessoa sem receberdoou
- ajustar — mudar algo para melhorar o funcionamento
- demonstração — exemplo ou prova usado para ensinardemonstrações
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Que vantagens e riscos você vê ao treinar agentes de IA com demonstrações de uma única cultura?
- Como os desenvolvedores poderiam aumentar e diversificar demonstrações culturais antes de usar um sistema?
- Além do altruísmo, que outros valores culturais seria importante testar em pesquisas futuras?
Artigos relacionados
Romani na Grande São Paulo buscam reconhecimento
Reportagem publicada em 30 de maio de 2025 no site Agência Mural descreve a luta por reconhecimento e acesso a serviços entre romani que vivem na periferia da Grande São Paulo, incluindo problemas causados por enchentes e falta de opção no censo do IBGE.