Uma pesquisa da University of Washington publicada em PLOS One examinou se agentes de inteligência artificial podem aprender valores específicos de uma cultura observando comportamento humano. Os autores partiram de estudos anteriores sobre diferenças culturais no altruísmo em crianças e recrutaram adultos que se identificaram como brancos e como latinos; os dados de cada grupo serviram para treinar agentes distintos.
Os agentes foram treinados com aprendizado por reforço inverso (IRL), uma técnica em que a IA observa ações humanas e infere os objetivos e recompensas que motivam essas ações, em vez de receber uma recompensa explícita. Os pesquisadores dizem que esse processo se aproxima de como crianças aprendem com modelos sociais; como observa o coautor Andrew Meltzoff, os pais modelam comportamentos em vez de treinar tarefas repetidas.
No teste principal, os participantes jogaram uma versão modificada do videogame Overcooked. Era possível doar cebolas para ajudar um segundo jogador que precisava caminhar mais, mas doar reduziria as entregas do doador. Em geral, o grupo latino ajudou mais que o grupo branco, e o agente treinado com dados latinos doou mais cebolas e também foi mais generoso em um segundo teste de doação de dinheiro.
O autor sênior Rajesh Rao ressalta que não se deve codificar rigidamente um conjunto universal de valores, porque muitas culturas têm valores próprios. Os autores sugerem que desenvolvedores podem aumentar e diversificar demonstrações específicas de cada cultura para ajustar finamente sistemas antes do uso. Pesquisa adicional é necessária para testar outros grupos culturais, valores concorrentes e problemas do mundo real. Coautores adicionais vêm da UW e da San Diego State University.
Palavras difíceis
- altruísmo — comportamento que beneficia outras pessoas
- inferir — tirar conclusão a partir de dados ou açõesinfere
- recrutar — convidar ou selecionar pessoas para participarrecrutaram
- doar — dar algo a outra pessoa sem receberdoou
- ajustar — mudar algo para melhorar o funcionamento
- demonstração — exemplo ou prova usado para ensinardemonstrações
Dica: passe o mouse, foque ou toque nas palavras destacadas no artigo para ver definições rápidas enquanto lê ou ouve.
Perguntas para discussão
- Que vantagens e riscos você vê ao treinar agentes de IA com demonstrações de uma única cultura?
- Como os desenvolvedores poderiam aumentar e diversificar demonstrações culturais antes de usar um sistema?
- Além do altruísmo, que outros valores culturais seria importante testar em pesquisas futuras?
Artigos relacionados
Nova IA ajuda estudantes de medicina a praticar sutura
Pesquisadores da Johns Hopkins criaram uma ferramenta de inteligência artificial explicável que orienta estudantes de medicina na prática de sutura. O sistema dá feedback personalizado por mensagem de texto; estudo com 12 alunos mostrou mais ganho entre os mais experientes.