Investigadores de la University of Zurich probaron cuatro LLMs populares: OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 y Mistral. Cada modelo generó fifty declaraciones narrativas sobre 24 temas controvertidos, como mandatos de vacunación, geopolítica y políticas de cambio climático.
Luego pidieron a los modelos que evaluaran esas declaraciones con diferentes fuentes: a veces sin autor y otras veces atribuyendo el texto a una persona de cierta nacionalidad o a otra IA. Recolectaron 192’000 valoraciones. Cuando no se dio la fuente, los modelos coincidieron over 90%. Al añadir fuentes ficticias, el acuerdo bajó mucho y apareció un sesgo marcado contra autores de China, incluso en Deepseek. Además, los modelos mostraron más confianza en autores humanos que en textos escritos por otras IA.
Palabras difíciles
- modelo — Un tipo o plan para algo.Modelos
- evaluar — Juzgar o examinar algo.evalúan, evaluación
- sesgo — Una tendencia que afecta la objetividad.
- autor — La persona que escribe un texto.autores
- confía — Creer en la habilidad de alguien.confían
- información — Conjunto de datos o hechos.
- moderación — Control o regulación de algo.
Consejo: pasa el cursor, enfoca o toca las palabras resaltadas en el artículo para ver definiciones rápidas mientras lees o escuchas.
Preguntas de discusión
- ¿Por qué crees que hay sesgo contra autores de China?
- ¿Cómo podría mejorar la evaluación de los MLG?
- ¿Qué impacto tiene la falta de información sobre el autor en el juicio de un texto?
Artículos relacionados
Sensores e inteligencia artificial para vigilar la salud en la ELA
La University of Missouri prueba sensores domésticos con inteligencia artificial para detectar cambios de salud en personas con esclerosis lateral amiotrófica. El sistema busca avisar a los clínicos y apoyar decisiones como ajustes de tratamiento.
Ana María Cetto y la ciencia abierta en América Latina
Ana María Cetto, física mexicana, fue nombrada presidenta del Comité Directivo de Ciencia Abierta de la UNESCO. Defiende el acceso abierto y promueve plataformas regionales como Latindex para compartir el conocimiento científico.
Empalme alternativo y longevidad en mamíferos
Un estudio comparó el empalme alternativo del ARN en 26 especies de mamíferos y halló que los cambios en el empalme predicen mejor la longevidad que la sola expresión génica. El cerebro mostró el doble de eventos vinculados a la longevidad.