Kial grandaj lingvmodeloj malsukcesas pri kvarcifera multiplikado (Esperanto, Nivelo B1)

Nova studo esploras kial modernaj grandaj lingvmodeloj malfortas pri ŝajne simpla tasko: multobligi du kvarciferajn nombrojn. Gvidado venis de Xiaoyan Bai kaj Chenhao Tan ĉe University of Chicago kun kunlaborantoj de kelkaj universitatoj kaj de Google DeepMind. La teamo komparis norman fajnan ĝustigon kun la metodo Implicit Chain of Thought (ICoT).

Sub normala fajna ĝustigo modeloj kun kelkaj tavoloj atingis malpli ol 1% precizecon. La esploristoj trovis ke tiuj modeloj fiksiĝas en loka optimumo: ili lernas surfacajn ŝablonojn en la trejna datumaro sed ne evoluigas vojon por konservi interajn valorojn por poste uzado.

Male, la ICoT-trejnita modelo atingis 100% precizecon. Analizo de internaj ŝtatoj montris ke ICoT kodas kurantajn sumojn kaj konservas cifern-parajn produktojn en difinitaj lokoj; pli malfruaj tavoloj reprenas tiujn valorojn por formi la finajn ciferojn. Aparte, la teamo ankaŭ montris plibonigon al 99% kiam oni aldonis trejnan celon por spuri kurantajn sumojn en malforta modelo.

Malfacilaj vortoj

studo — Esplorado pri specifa temo aŭ afero

multobligi — Fari aritmetikan operacion por kalkuli la produkton

fajna ĝustigo — Metodo por adapti jam trejnitan modelon

fajnan ĝustigon

optimumo — Punkto kun plej bona aŭ stabila solvo

trejna datumaro — Kolekto de ekzemploj uzataj por trejni modelon

precizeco — Grado de ĝusta aŭ korekta rezultaĵo

precizecon

konservi — Tenigi informojn por uzo poste

konservas

Konsilo: ŝovu la musmontrilon, fokusu aŭ tuŝu la reliefigitajn vortojn en la artikolo por vidi rapidajn difinojn dum legado aŭ aŭskultado.

Rilataj artikoloj

17 Feb 2026

Procesrapideca trejnado malpliigis demencodiagnozojn

Plenkreskuloj aĝaj 65+ kiuj faris procesrapidecan trejnadon malpli ofte ricevis diagnozon de demenco laŭ 20‑jara sekvado. La analizo montras ke ŝtupoj kaj pliaj sesioj estas ligitaj al pli malalta risko.

Nivelo

Legi

8 Jul 2025

Somera teknologia trejnado por infanoj en Kameruno

Dum someraj ferioj gepatroj en Kameruno registras siajn infanojn por kursoj pri programado, robotiko kaj AI. Infanoj montras projektojn ĉe Demo Day kaj kelkaj centroj starigas teknologiajn klubojn en lernejoj.

Nivelo

Legi

25 Nov 2025

Nova neinvada maniero por mezuri sang-viskozecon

Esploristoj ĉe University of Missouri evoluigis neinvadan aparaton, kiu uzas ultrasonon kaj programaron por mezuri viskozecon de sango en reala tempo. La teknologio povas helpi en klinikaj aplikaĵoj kaj eble fariĝi portebla.

Nivelo

Legi

24 Feb 2026

Nova molekulo stokas sunlumon kaj liberigas varmecon

Ĥemiistoj ĉe UC Santa Barbara prezentas modifitan organikan molekulon, pyrimidone, kiu kaptas sunlumon, stokas ĝin en kemiaj obligacioj kaj poste liberigas ĝin kiel varmecon por uzo post sunsubiro.

Nivelo

Legi

15 Apr 2026

Kiel la retino integras vidaĵon

Esploristoj trovis ke paralelaj vidaĵaj kanaloj en la retino estas pli interkonektitaj ol oni pensis. Tio helpas detekti malfortajn signalojn kaj estis montrita en eksperimentoj kun musaj kaj homaj retinoj.

Nivelo

Legi

Kial grandaj lingvmodeloj malsukcesas pri kvarcifera multiplikado^{CEFR B1}

Malfacilaj vortoj

Diskutaj demandoj

Rilataj artikoloj

Procesrapideca trejnado malpliigis demencodiagnozojn

Somera teknologia trejnado por infanoj en Kameruno

Nova neinvada maniero por mezuri sang-viskozecon

Nova molekulo stokas sunlumon kaj liberigas varmecon

Kiel la retino integras vidaĵon

Kial grandaj lingvmodeloj malsukcesas pri kvarcifera multiplikado CEFR B1

Malfacilaj vortoj

Diskutaj demandoj

Rilataj artikoloj

Procesrapideca trejnado malpliigis demencodiagnozojn

Somera teknologia trejnado por infanoj en Kameruno

Nova neinvada maniero por mezuri sang-viskozecon

Nova molekulo stokas sunlumon kaj liberigas varmecon

Kiel la retino integras vidaĵon

Kial grandaj lingvmodeloj malsukcesas pri kvarcifera multiplikado^{CEFR B1}