北卡研究：让大型语言模型更安全 (中文, 等级 A2)

北卡罗来纳州立大学的研究人员研究大型语言模型的安全问题。团队发现，有些训练方法会让模型更容易拒绝危险请求，但这也可能降低模型准确性。

研究人员提出一种办法：在训练时冻结与安全相关的神经元，这样模型在学习新任务时还能保持原有的安全行为。团队报告说，这种方法可以减少不安全输出，同时尽量保持模型性能。研究成果将发表于 ICLR2026，相关代码和信息在官网提供。

难词

大型语言模型 — 能理解和生成语言的模型

训练方法 — 教模型学习的步骤或方式

冻结 — 训练时停止改变某些部分

神经元 — 神经网络里负责计算的单元

输出 — 模型产生的文字或结果

准确性 — 答案或结果的正确程度

性能 — 模型运行的效率和表现

提示：在文章中将鼠标悬停、聚焦或轻触高亮词语，即可在阅读或听音频时快速查看简要释义。

数字零工在非洲快速扩展，智能手机普及后自2015年起增长并在2020年后加速。拉各斯、阿克拉和内罗毕成为重要枢纽，女性约占线上零工劳动力的27%，但平台费用和不确定性仍是挑战。

等级

一项研究发现，练习使用机器人下肢假肢的人虽然行走表现改善，但对自己步态的判断并不准确。研究建议通过视觉或其他反馈来校准身体感知，并注意防止过度自信。

等级

数月空袭扰乱伊朗高校与研究机构，自2月底美以攻势以来，已有超过30所大学受损，许多教学转为线上。联合国教科文组织警告科研与实践培训将长期受影响。

等级

过去五年，印尼许多女性记者和女权活动家在网上遭到长期骚扰和针对性攻击。受害者、组织与平台和当局之间正在争取更快、更有文化敏感度的应对。

等级

研究人员开发一种可解释的人工智能工具，用于指导医学生练习缝合并提供即时、个性化反馈。团队在一项随机对照研究中比较了AI指导和观看外科医生录像的训练效果。

等级

北卡研究：让大型语言模型更安全^{CEFR A2}