Un estudio comparó dos formas de entrenar modelos de lenguaje para multiplicar números largos. Los investigadores observaron que los modelos entrenados de forma estándar no guardan valores intermedios, por eso fallan en pasos largos.
El equipo probó un método llamado cadena de pensamiento implícita (ICoT). Con ICoT el modelo alcanzó 100% de precisión en la tarea, mientras que los modelos estándar tuvieron una precisión muy baja, por debajo del 1%.
También probaron añadir un objetivo de entrenamiento para que el modelo siga las sumas parciales. Al hacerlo, un modelo pequeño mejoró mucho y logró cerca del 99% de precisión.
Palabras difíciles
- método — Manera organizada para hacer algo
- precisión — Porcentaje de respuestas correctas en una tarea
- intermedio — Que está entre dos etapas o valoresintermedios
- cadena de pensamiento implícita — Secuencia de pasos internos en el razonamiento
- sumas parciales — Cálculos de sumas de partes de un problema
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o audicións.
Preguntas de discusión
- ¿Crees que es útil que un modelo guarde valores intermedios? ¿Por qué?
- ¿Te parece importante la precisión en una tarea de multiplicar? Explica en una frase.
- ¿Has usado o aprendido sumas parciales para resolver operaciones? Describe una vez breve.
Artículos relacionados
Nueva herramienta de luz para medir actividad en células cerebrales
Científicos desarrollaron una herramienta basada en bioluminiscencia para medir la actividad dentro de células cerebrales vivas. La molécula llamada CaBLAM funciona en ratones y peces cebra y permite grabaciones continuas sin luz externa.
Dosis altas de antioxidantes pueden afectar el esperma y los hijos
Un estudio en ratones muestra que el consumo regular de dosis altas de antioxidantes dañó el ADN del esperma y produjo cambios en la forma del cráneo y la cara de la descendencia. Los autores aconsejan precaución para hombres que planean tener hijos.