Por qué los modelos fallan al multiplicar números largos — Español Nivel B1

Investigadores de varias universidades examinaron por qué los modelos de lenguaje fallan al multiplicar dos números de cuatro cifras. El estudio, dirigido por Xiaoyan Bai y Chenhao Tan en University of Chicago con colaboradores de MIT, Harvard, Waterloo y Google DeepMind, comparó el ajuste fino estándar con la cadena de pensamiento implícita (ICoT).

Encontraron que los modelos estándar, incluso con dos a 12 capas, lograban menos del 1% de precisión porque no desarrollan un mecanismo para almacenar valores intermedios. En cambio, el modelo entrenado con ICoT alcanzó 100% de precisión y sus estados internos contenían las sumas acumuladas.

Al añadir un objetivo de seguimiento de las sumas acumuladas a un modelo de dos capas, la precisión subió hasta el 99% sin supervisión explícita de cadena de pensamiento. Los autores concluyen que la arquitectura y los objetivos de entrenamiento son clave para el razonamiento en varios pasos.

Palabras difíciles

ajuste fino — Entrenamiento adicional de un modelo existente.

ajuste fino estándar

cadena de pensamiento — Secuencia de pasos mentales o razonamiento interno.

precisión — Porcentaje de respuestas correctas en una tarea.

valor intermedio — Número o resultado guardado entre pasos.

valores intermedios

suma acumulada — Total que se va guardando al sumar varios valores.

sumas acumuladas

supervisión explícita — Control directo durante el entrenamiento del modelo.

arquitectura — Diseño y organización de las partes del modelo.

Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o escuchas.

Preguntas de discusión

¿Por qué crees que almacenar valores intermedios ayuda a resolver multiplicaciones largas?

¿Preferirías un modelo con supervisión explícita o uno que aprenda implícitamente la cadena de pensamiento? Explica tu opinión.

¿Qué cambios simples podrías imaginar en la arquitectura de un modelo para mejorar su razonamiento en varios pasos?

Ciudades asiáticas combaten la congestión y la contaminación

La congestión en ciudades de Asia genera emisiones y pérdidas económicas. Varias urbes aplican medidas: retiro de vehículos viejos, más transporte eléctrico y ampliación del metro, y usan tecnología para gestionar el tráfico.

Nivel

Leer

25 nov 2025

Modelos de lenguaje muestran sesgos según la identidad del autor

Un estudio de la University of Zurich encontró que grandes modelos de lenguaje cambian sus juicios cuando se indica quién escribió un texto. Detectaron un fuerte sesgo anti‑chino y recogieron 192’000 valoraciones.

Nivel

Leer

29 dic 2025

Simulación de realidad virtual reduce el miedo a la muerte

Un pequeño estudio piloto con estudiantes mostró que una breve sesión de realidad virtual redujo notablemente la ansiedad ante la muerte y el estrés. Los investigadores planean ampliar la investigación con cautela.

Nivel

Leer

14 dic 2025

Tratar la inflamación podría ayudar en la depresión

Una revisión y metaanálisis hallaron que fármacos antiinflamatorios reducen los síntomas de depresión y la anhedonia en personas con alta inflamación, sin aumento de efectos secundarios graves.

Nivel

Leer

7 mar 2026

Cortes de luz en Mile Four y crecimiento de la energía solar

Los vecinos de Mile Four, en Bamenda, sufren apagones prolongados por problemas en la red y menor producción hidroeléctrica. Ante la inestabilidad, la comunidad compró un transformador y muchas viviendas instalaron paneles solares.

Nivel

Leer

Por qué los modelos fallan al multiplicar números largos^{CEFR B1}

Palabras difíciles

Preguntas de discusión

Artículos relacionados

Ciudades asiáticas combaten la congestión y la contaminación

Modelos de lenguaje muestran sesgos según la identidad del autor

Simulación de realidad virtual reduce el miedo a la muerte

Tratar la inflamación podría ayudar en la depresión

Cortes de luz en Mile Four y crecimiento de la energía solar

Por qué los modelos fallan al multiplicar números largos CEFR B1

Palabras difíciles

Preguntas de discusión

Artículos relacionados

Ciudades asiáticas combaten la congestión y la contaminación

Modelos de lenguaje muestran sesgos según la identidad del autor

Simulación de realidad virtual reduce el miedo a la muerte

Tratar la inflamación podría ayudar en la depresión

Cortes de luz en Mile Four y crecimiento de la energía solar

Por qué los modelos fallan al multiplicar números largos^{CEFR B1}