LingVo.club
Nivelo
Kial grandaj lingvmodeloj malsukcesas pri kvarcifera multiplikado — Nivelo B1 — brown wooden blocks on white surface

Kial grandaj lingvmodeloj malsukcesas pri kvarcifera multiplikadoCEFR B1

29 Dec 2025

Nivelo B1 – Meza nivelo
3 min
150 vortoj

Nova studo esploras kial modernaj grandaj lingvmodeloj malfortas pri ŝajne simpla tasko: multobligi du kvarciferajn nombrojn. Gvidado venis de Xiaoyan Bai kaj Chenhao Tan ĉe University of Chicago kun kunlaborantoj de kelkaj universitatoj kaj de Google DeepMind. La teamo komparis norman fajnan ĝustigon kun la metodo Implicit Chain of Thought (ICoT).

Sub normala fajna ĝustigo modeloj kun kelkaj tavoloj atingis malpli ol 1% precizecon. La esploristoj trovis ke tiuj modeloj fiksiĝas en loka optimumo: ili lernas surfacajn ŝablonojn en la trejna datumaro sed ne evoluigas vojon por konservi interajn valorojn por poste uzado.

Male, la ICoT-trejnita modelo atingis 100% precizecon. Analizo de internaj ŝtatoj montris ke ICoT kodas kurantajn sumojn kaj konservas cifern-parajn produktojn en difinitaj lokoj; pli malfruaj tavoloj reprenas tiujn valorojn por formi la finajn ciferojn. Aparte, la teamo ankaŭ montris plibonigon al 99% kiam oni aldonis trejnan celon por spuri kurantajn sumojn en malforta modelo.

Malfacilaj vortoj

  • studoEsplorado pri specifa temo aŭ afero
  • multobligiFari aritmetikan operacion por kalkuli la produkton
  • fajna ĝustigoMetodo por adapti jam trejnitan modelon
    fajnan ĝustigon
  • optimumoPunkto kun plej bona aŭ stabila solvo
  • trejna datumaroKolekto de ekzemploj uzataj por trejni modelon
  • precizecoGrado de ĝusta aŭ korekta rezultaĵo
    precizecon
  • konserviTenigi informojn por uzo poste
    konservas

Konsilo: ŝovu la musmontrilon, fokusu aŭ tuŝu la reliefigitajn vortojn en la artikolo por vidi rapidajn difinojn dum legado aŭ aŭskultado.

Diskutaj demandoj

  • Ĉu vi pensas, ke metodoj kiel ICoT povus helpi solvi aliajn malfacilajn problemojn? Kial aŭ kial ne?
  • Kiam vi lernas, ĉu vi preferas konservi interajn paŝojn aŭ nur la finan respondon? Klarigu vian preferon.
  • Kiel vi komprenas la esprimon "loka optimumo"? Donu simplan ekzemplon el ĉiutaga vivo.

Rilataj artikoloj

Tuŝekranoj en aŭtoj kaj atento — Nivelo B1
26 Dec 2025

Tuŝekranoj en aŭtoj kaj atento

Studo uzis veturilsimulilon por vidi kiel grandaj tuŝekranoj influas veturadon. Multtaskado malpliigis la veturadon kaj la tuŝekranan precizecon; esploristoj proponas sensilojn por observi atenton kaj ŝanĝi la interfacon.