Federico Germani e Giovanni Spitale hanno testato quattro LLM molto usati: OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 e Mistral. Ogni modello ha generato 50 enunciati su 24 argomenti controversi e poi ha valutato quegli enunciati in condizioni diverse.
Quando non si indicava l'autore, l'accordo tra i modelli superava il 90% su tutti gli argomenti. Ma quando i ricercatori hanno attribuito i testi a persone di certe nazionalità o ad altre AI, l'accordo è sceso molto. È emerso un bias anti-cinese anche in Deepseek, che è cinese. Su un tema come Taiwan, l'accordo di Deepseek è sceso al 75%.
I ricercatori avvertono che questi pregiudizi possono influenzare la moderazione, le assunzioni e il giornalismo. Raccomandano trasparenza e che gli LLM assistano il ragionamento, non lo sostituiscano. La ricerca è apparsa in Science Advances.
Parole difficili
- giudizio — Opinione o valutazione su qualcosa.giudizi
- modelli — Esempi o sistemi per capire qualcosa.
- ricercatori — Persone che studiano o indagano su un argomento.
- scrivere — Mettere parole su carta o schermo.scritto
- nazionalità — Origine o appartenenza a un paese.
- problema — Situazione difficile da risolvere.
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Qual è l'importanza di avere informazioni sull'autore?
- Come pensi che l'AI influisca sulle opinioni dei lettori?
- È giusto fidarsi di modelli linguistici? Perché?
Articoli correlati
JWST crea una mappa dettagliata della rete cosmica
Il James Webb Space Telescope ha permesso di mappare la rete cosmica con dettaglio inedito usando il sondaggio COSMOS‑Web. La mappa copre gran parte della storia dell’universo e include un grande catalogo di galassie e dati pubblici.
Piccole pause per frenare la disinformazione sui social
Ricercatori dell'University of Copenhagen propongono di rendere più difficile la condivisione con una breve pausa e un elemento di apprendimento. Un modello mostra che la frizione digitale e brevi quiz possono ridurre le condivisioni impulsive.