Des chercheurs de l'University of Washington publient dans PLOS One une étude sur l'apprentissage des valeurs culturelles par l'intelligence artificielle. Ils partent d'observations antérieures selon lesquelles des enfants de 19 mois élevés dans des foyers latino et asiatiques montrent davantage d'altruisme que des enfants d'autres cultures. L'équipe a recruté 190 adults who identified as white et 110 who identified as Latino pour obtenir des données comportementales distinctes.
Les agents ont été entraînés par apprentissage par renforcement inverse (IRL). Plutôt que de donner un objectif clair et des récompenses fixes, l'IRL permet à l'IA d'observer le comportement humain et d'inférer les objectifs et récompenses sous-jacents. Les auteurs rapprochent cette méthode de la façon dont les enfants apprennent en observant des modèles humains, selon Andrew Meltzoff, professeur de psychologie et codirecteur de l'I-LABS.
Dans l'expérience principale, les participants jouaient à une version modifiée d'Overcooked. Ils pouvaient donner des oignons pour aider un second joueur, au prix de livrer moins de soupe eux-mêmes. L'agent entraîné sur les données latinos donnait plus d'oignons. Dans un second test, l'agent latino se montrait encore plus enclin à donner une partie de son argent à une personne dans le besoin.
Rajesh Rao, professeur à la Paul G. Allen School of Computer Science & Engineering et codirecteur du Center for Neurotechnology, souligne qu'il ne faut pas coder rigidement un ensemble universel de valeurs et que l'on peut affiner les systèmes en augmentant les données propres à chaque culture. Des coauteurs viennent de l'UW et de San Diego State University. Source : University of Washington.
Mots difficiles
- altruisme — comportement qui aide les autres sans profit
- renforcement — procédé d'apprentissage fondé sur récompenserenforcement inverse
- inférer — déduire une intention ou un objectif à partir d'observationsd'inférer
- agent — programme ou système informatique autonomeagents
- affiner — rendre plus précis ou mieux adapté
- récompense — signe ou valeur donné pour encouragerrécompenses
- codirecteur — personne qui dirige un projet avec un autre
Astuce : survolez, mettez le focus ou touchez les mots en surbrillance dans l’article pour voir des définitions rapides pendant que vous lisez ou écoutez.
Questions de discussion
- Quels risques et avantages voyez-vous à entraîner des intelligences artificielles avec des données culturelles spécifiques ?
- Comment, selon vous, les concepteurs pourraient-ils collecter des données propres à chaque culture de façon éthique ?
- Pensez-vous que des agents différents selon la culture pourraient poser des problèmes dans des contextes internationaux ? Pourquoi ?
Articles liés
Un écart alimentaire n’annule pas la perte de poids
Une revue scientifique montre qu’un seul écart n’efface généralement pas la perte de poids. L’impact psychologique d’un repas peut être plus important que les calories; des repas planifiés aident souvent, tandis que les écarts imprévus risquent culpabilité et frénésie.
Après 2008, beaucoup d'Américains se sentent de classe inférieure
Des recherches montrent que la Grande Récession de 2008 a poussé de nombreux Américains à s'identifier comme appartenant à une classe sociale inférieure. Ce changement d'identité semble durable et provient d'analyses sur de grandes données.