Des chercheurs de l'University of Washington publient dans PLOS One une étude sur l'apprentissage des valeurs culturelles par l'intelligence artificielle. Ils partent d'observations antérieures selon lesquelles des enfants de 19 mois élevés dans des foyers latino et asiatiques montrent davantage d'altruisme que des enfants d'autres cultures. L'équipe a recruté 190 adults who identified as white et 110 who identified as Latino pour obtenir des données comportementales distinctes.
Les agents ont été entraînés par apprentissage par renforcement inverse (IRL). Plutôt que de donner un objectif clair et des récompenses fixes, l'IRL permet à l'IA d'observer le comportement humain et d'inférer les objectifs et récompenses sous-jacents. Les auteurs rapprochent cette méthode de la façon dont les enfants apprennent en observant des modèles humains, selon Andrew Meltzoff, professeur de psychologie et codirecteur de l'I-LABS.
Dans l'expérience principale, les participants jouaient à une version modifiée d'Overcooked. Ils pouvaient donner des oignons pour aider un second joueur, au prix de livrer moins de soupe eux-mêmes. L'agent entraîné sur les données latinos donnait plus d'oignons. Dans un second test, l'agent latino se montrait encore plus enclin à donner une partie de son argent à une personne dans le besoin.
Rajesh Rao, professeur à la Paul G. Allen School of Computer Science & Engineering et codirecteur du Center for Neurotechnology, souligne qu'il ne faut pas coder rigidement un ensemble universel de valeurs et que l'on peut affiner les systèmes en augmentant les données propres à chaque culture. Des coauteurs viennent de l'UW et de San Diego State University. Source : University of Washington.
Mots difficiles
- altruisme — comportement qui aide les autres sans profit
- renforcement — procédé d'apprentissage fondé sur récompenserenforcement inverse
- inférer — déduire une intention ou un objectif à partir d'observationsd'inférer
- agent — programme ou système informatique autonomeagents
- affiner — rendre plus précis ou mieux adapté
- récompense — signe ou valeur donné pour encouragerrécompenses
- codirecteur — personne qui dirige un projet avec un autre
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Quels risques et avantages voyez-vous à entraîner des intelligences artificielles avec des données culturelles spécifiques ?
- Comment, selon vous, les concepteurs pourraient-ils collecter des données propres à chaque culture de façon éthique ?
- Pensez-vous que des agents différents selon la culture pourraient poser des problèmes dans des contextes internationaux ? Pourquoi ?
Articles liés
Guérison ancestrale et santé dans les Caraïbes
Dans les Caraïbes, des personnes comme Gilbert Martina utilisent savoirs ancestraux et pratiques apaisantes pour soigner des blessures historiques. La science montre que le traumatisme et le stress affectent la santé physique à long terme.
Une IA qui apprend pourquoi les titres fonctionnent
Une étude de la Yale School of Management montre qu’une IA générative qui apprend pourquoi certains titres attirent les lecteurs produit des titres plus engageants et plus fiables. Les chercheurs utilisent des hypothèses testées sur des données A/B.