Esploristoj de Brown University prezentis ĉe ICLR en Rio de Janeiro studon pri tio ĉu modernaj lingvaj modeloj enkodigas scion pri la reala mondo. Michael Lepori, PhD‑kandidato ĉe Brown kaj gvidanto de la teamo, diras ke la rezultoj montras "iun indicon ke lingvaj modeloj enkodigis ion similan al la kaŭzaj limigoj de la reala mondo." Li klarigas, ke la modeloj enkodigas tiujn limigojn en manieroj kiuj antaŭdiras homajn juĝojn.
La teamo desegnis kontrolitan eksperimenton kun frazoj kiuj havis malsaman plausiblecon: kutimaj eventoj (ekzemple malvarmigi trinkaĵon per glacio), neverŝajnaj (per neĝo), neeblaj (per fajro) kaj sensencaj deklaroj (per la vorto "hieraŭ"). Por ĉiu frazo oni rigardis la internajn matematikajn statojn, metodon nomatan mekanista interpretado — priskribata kiel "neŭroscienco por AI‑sistemoj" — kiu celas malantaŭenmeti kion la modelo enkodigas en sia interna "cerba stato."
Por resti model-agnostic, la eksperimentoj kuriĝis tra pluraj malfermfontecaj kaj grandaj modelo‑specoj, inkluzive de konataj sistemoj. La studo trovis, ke sufiĉe grandaj modeloj evoluigis apartajn internajn vektorojn kiuj korespondas al plausiblecaj kategorioj; tiuj vektoroj povis distingi eĉ similajn kategoriojn, kiel neverŝajne kontraŭ neebla, kun proksimume 85% precizeco. La vektoroj ankaŭ reflektis homan necertecon: por ambiguaj deklaroj la modelaj eligoj kongruis kun disdividitaj homaj juĝoj.
La esploristoj raportas, ke tiuj vektoroj komencas aperi en modeloj kun pli ol 2 billion parameters, grandeco malgranda kompare kun hodiaŭaj modeloj kun pli ol triliono da parametroj. La trovoj povus helpi evoluigi pli inteligentajn kaj pli fidindajn modelojn.
- Mekanista interpretado malkaŝas internajn kodojn.
- Internaj vektoroj mapigas al homaj plausiblecaj juĝoj.
- La rezultoj povas plifortigi modelan fidindecon.
Malfacilaj vortoj
- enkodigi — stoki aŭ reprezenti informon interne en modeloenkodigis, enkodigas
- vektoro — nombraj listo aŭ punkto en matematika spacovektorojn, vektoroj
- plausibleco — grado de ĉu io ŝajnas ebla aŭ realaplausiblecon, plausiblecaj
- interpretado — klarigo aŭ analizo de signifoj aŭ mekanismoj
- parametro — numeraj valoroj kiuj influas modelan kondutonparametroj
- fidindeco — grado de konfido ke sistemo funkcias ĝustefidindecon
- necerteco — manko de certa scio pri rezulto aŭ statonecertecon
- kaŭza — rilata al kaŭzoj aŭ kialoj, ne simple korelatokaŭzaj
Konsilo: ŝovu la musmontrilon, fokusu aŭ tuŝu la reliefigitajn vortojn en la artikolo por vidi rapidajn difinojn dum legado aŭ aŭskultado.
Diskutaj demandoj
- Kiel, laŭ vi, la trovoj pri internaj vektoroj povus helpi fari pli fidindajn lingvajn modelojn? Donu konkretajn ekzemplojn.
- Kion signifas por vi, ke modeloj reflektas homan necertecon? Kiel tio influas uzon de modeloj en decidaj situacioj?
- Kiaj limigoj aŭ riskoj povas resti malfermaj se la studo baziĝas sur kontrolitaj frazoj anstataŭ sur kompleksaj realaj situacioj?
Rilataj artikoloj
Afriko devas financi siajn proprajn medicinajn novigojn
Afrikaj sciencistoj diras, ke la kontinento bezonas konstrui kaj financi siajn proprajn sanajn novigojn por redukti dependecon de nesekura internacia financado. Ili petas pli da nacia investo, reformojn pri aĉetado kaj plifortigon de lokaj kapabloj.