#機械学習1
2025年12月29日
大規模言語モデルが4桁の掛け算でつまずく理由
研究チームは、標準的な訓練法がモデルに途中の計算結果を保存させないため、4桁の掛け算で誤りが出ると説明します。別の訓練法(ICoT)は中間値を保持し精度を大幅に改善しました。
写真: Brett Jordan, Unsplash
研究チームは、標準的な訓練法がモデルに途中の計算結果を保存させないため、4桁の掛け算で誤りが出ると説明します。別の訓練法(ICoT)は中間値を保持し精度を大幅に改善しました。
写真: Brett Jordan, Unsplash