Un documento del 2025 ha mostrato che molti grandi modelli linguistici funzionano male in lingue diverse dall'inglese. Questo avviene perché gran parte dei dati online e dell'addestramento è in inglese.
Test e articoli hanno riportato esempi pratici: per esempio chiedere a ChatGPT di scrivere un'e-mail in tamil può restituire una bozza confusa in inglese. Inoltre, molti testi raccolti sul web contengono errori di traduzione che diventano dati di addestramento.
Per ridurre il problema, gli esperti suggeriscono di lavorare con comunità locali, validare i dati multilingue e creare partnership rispettose delle differenze culturali.
Parole difficili
- modello linguistico — programma che genera o analizza testi scrittimodelli linguistici
- dato — informazione raccolta e usata per calcolidati
- addestramento — procedura per insegnare a un sistema
- traduzione — trasferire parole da una lingua all'altra
- validare — controllare se qualcosa è corretto o giusto
- lingua — sistema di parole usato da una comunitàlingue
Suggerimento: passa il mouse o tocca le parole evidenziate nell’articolo per vedere definizioni rapide mentre leggi o ascolti.
Domande di discussione
- Hai mai ricevuto testo tradotto male da un programma? Come era?
- Perché secondo te è importante lavorare con comunità locali quando si raccolgono dati?
Articoli correlati
Bambini in Camerun imparano programmazione e robotica
Durante le vacanze estive molte famiglie in Camerun iscrivono i figli a corsi di programmazione, robotica e intelligenza artificiale. I campi estivi includono dimostrazioni, progetti pratici e avviano club tecnologici nelle scuole.