- Investigadores estudian modelos de lenguaje grandes.
- Quieren saber por qué fallan en cálculo.
- La tarea es multiplicar dos números largos.
- Los modelos no guardan resultados intermedios.
- Sin esos valores no pueden completar pasos.
- Un método nuevo ayuda a guardar valores.
- Ese método permite usar resultados en pasos siguientes.
- Con el nuevo método la multiplicación funciona mejor.
- El estudio muestra cambios en la atención del modelo.
- Los resultados dicen que el entrenamiento es importante.
Palabras difíciles
- investigador — Persona que hace investigación científicaInvestigadores
- lenguaje — Sistema de palabras para comunicar ideas
- cálculo — Operaciones matemáticas como suma o multiplicación
- multiplicar — Hacer una operación para aumentar números
- intermedio — Valor que está entre dos otros valoresintermedios
- entrenamiento — Proceso para enseñar o mejorar habilidades
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o escuchas.
Preguntas de discusión
- ¿Te gusta resolver multiplicaciones?
- ¿Prefieres usar calculadora o papel?
- ¿Crees que el entrenamiento es importante?
Artículos relacionados
La restricción calórica mejora la respuesta a la insulina en ratas mayores
Un estudio con ratas de 24 meses mostró que reducir las calorías cambia las proteínas del músculo y mejora la captación de glucosa por la insulina. Muchas respuestas moleculares difieren entre machos y hembras.
Mejorar la seguridad en modelos de lenguaje
Investigadores de North Carolina State University estudiaron cómo mejorar el alineamiento de seguridad en modelos de lenguaje grande. Identificaron neuronas clave y probaron congelarlas al afinar para reducir salidas inseguras sin perder rendimiento.
Repensar lo humano en la inteligencia artificial
La artista Xonorika Kira critica la idea de 'centrar lo humano' en la inteligencia artificial porque excluye otras formas de conocimiento. Propone reconocer la interdependencia entre especies, tecnologías y planetas y cambiar cómo se usan datos y modelos.