Un estudio comparó dos formas de entrenar modelos de lenguaje para multiplicar números largos. Los investigadores observaron que los modelos entrenados de forma estándar no guardan valores intermedios, por eso fallan en pasos largos.
El equipo probó un método llamado cadena de pensamiento implícita (ICoT). Con ICoT el modelo alcanzó 100% de precisión en la tarea, mientras que los modelos estándar tuvieron una precisión muy baja, por debajo del 1%.
También probaron añadir un objetivo de entrenamiento para que el modelo siga las sumas parciales. Al hacerlo, un modelo pequeño mejoró mucho y logró cerca del 99% de precisión.
Palabras difíciles
- método — Manera organizada para hacer algo
- precisión — Porcentaje de respuestas correctas en una tarea
- intermedio — Que está entre dos etapas o valoresintermedios
- cadena de pensamiento implícita — Secuencia de pasos internos en el razonamiento
- sumas parciales — Cálculos de sumas de partes de un problema
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o escuchas.
Preguntas de discusión
- ¿Crees que es útil que un modelo guarde valores intermedios? ¿Por qué?
- ¿Te parece importante la precisión en una tarea de multiplicar? Explica en una frase.
- ¿Has usado o aprendido sumas parciales para resolver operaciones? Describe una vez breve.
Artículos relacionados
Un estudio conecta la biología celular con las redes cerebrales
Un estudio publicado en Nature Communications conecta datos de imágenes, genética y moléculas para mostrar cómo la biología celular produce las grandes redes cerebrales. El hallazgo puede cambiar el estudio de la cognición y trastornos mentales.
Connie Nshemereirwe y la ciencia en África
Connie Nshemereirwe, especialista en medición educativa y exingeniera, reclama que la investigación en África nazca desde la base y que la ciencia responda a retos locales. También habla de comunicación científica y de la situación escolar tras la pandemia.
IA para salud sexual y reproductiva en América Latina
Grupos en América Latina usan inteligencia artificial para dar información sobre salud sexual y reproductiva. Proyectos en Perú y Argentina buscan llegar a jóvenes, comunidades indígenas y personas trans, y también hay advertencias sobre sesgos y daños.
Un circuito cerebral puede ayudar a prevenir recaídas por opioides
Investigadores hallaron que reducir la actividad de un circuito entre la corteza prelimbica y el tálamo paraventricular disminuye la búsqueda de drogas en un modelo preclínico. El estudio sugiere vías para futuras terapias.