Un documento del 2025 ha mostrato che molti grandi modelli linguistici funzionano male in lingue diverse dall'inglese. Questo avviene perché gran parte dei dati online e dell'addestramento è in inglese.
Test e articoli hanno riportato esempi pratici: per esempio chiedere a ChatGPT di scrivere un'e-mail in tamil può restituire una bozza confusa in inglese. Inoltre, molti testi raccolti sul web contengono errori di traduzione che diventano dati di addestramento.
Per ridurre il problema, gli esperti suggeriscono di lavorare con comunità locali, validare i dati multilingue e creare partnership rispettose delle differenze culturali.
Parole difficili
- modello linguistico — programma che genera o analizza testi scrittimodelli linguistici
- dato — informazione raccolta e usata per calcolidati
- addestramento — procedura per insegnare a un sistema
- traduzione — trasferire parole da una lingua all'altra
- validare — controllare se qualcosa è corretto o giusto
- lingua — sistema di parole usato da una comunitàlingue
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Hai mai ricevuto testo tradotto male da un programma? Come era?
- Perché secondo te è importante lavorare con comunità locali quando si raccolgono dati?
Articoli correlati
Archivio digitale per salvare le lingue del Bangladesh
Un progetto del governo del Bangladesh ha creato il sito Multilingual Cloud per documentare 42 lingue indigene. Il portale pubblica parole, frasi, trascrizioni in IPA e registrazioni audio per conservare le lingue in pericolo.
L'intelligenza artificiale nella sanità dell'Africa subsahariana
Progetti con algoritmi e smartphone stanno cambiando l'assistenza primaria in alcune aree dell'Africa subsahariana. Studi e piloti mostrano diagnosi più rapide, meno prescrizioni inappropriate e riduzione di alcune complicanze.
Giochi al computer migliorano il cervello dopo una lesione
Una ricerca trova che persone con lesioni cerebrali traumatiche possono migliorare la struttura del cervello e le capacità cognitive giocando a esercizi cognitivi al computer. Lo studio ha rilevato cambiamenti nella neuroplasticità e miglioramenti nei test di velocità, attenzione e memoria.