Un estudio comparó dos formas de entrenar modelos de lenguaje para multiplicar números largos. Los investigadores observaron que los modelos entrenados de forma estándar no guardan valores intermedios, por eso fallan en pasos largos.
El equipo probó un método llamado cadena de pensamiento implícita (ICoT). Con ICoT el modelo alcanzó 100% de precisión en la tarea, mientras que los modelos estándar tuvieron una precisión muy baja, por debajo del 1%.
También probaron añadir un objetivo de entrenamiento para que el modelo siga las sumas parciales. Al hacerlo, un modelo pequeño mejoró mucho y logró cerca del 99% de precisión.
Palabras difíciles
- método — Manera organizada para hacer algo
- precisión — Porcentaje de respuestas correctas en una tarea
- intermedio — Que está entre dos etapas o valoresintermedios
- cadena de pensamiento implícita — Secuencia de pasos internos en el razonamiento
- sumas parciales — Cálculos de sumas de partes de un problema
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o audicións.
Preguntas de discusión
- ¿Crees que es útil que un modelo guarde valores intermedios? ¿Por qué?
- ¿Te parece importante la precisión en una tarea de multiplicar? Explica en una frase.
- ¿Has usado o aprendido sumas parciales para resolver operaciones? Describe una vez breve.
Artículos relacionados
Nuevo andamiaje sin materiales animales para tejido cerebral
Científicos han creado un andamiaje poroso que permite cultivar tejido similar al cerebro sin recubrimientos de origen animal. El trabajo, liderado en UC Riverside, busca modelos más reproducibles para estudiar enfermedades y probar fármacos.
Estudio: terapias complementarias se asocian a peor supervivencia en cáncer de mama
Un estudio encontró que usar medicina complementaria y alternativa se asocia con menor supervivencia en cáncer de mama. Analizaron datos de una gran base y hallaron peores resultados cuando faltaron tratamientos tradicionales.