等级 B2 – 中高级CEFR B2
4 分钟
239 字
研究发表在《EPJ Data Science》,旨在改进在冲突和灾害期间预测人口迁移的工具。研究团队检视了三个具体案例——乌克兰、苏丹和委内瑞拉——并分析了近200万条、用三种语言发布在 X(前称 Twitter)上的帖文,以检验数字数据在传统调查难以获得时是否能提供有价值信号。
比较多种方法后,研究发现用情感标签(积极、消极、中性)比用情绪标签(如喜悦、愤怒、恐惧)更能可靠地预测人们何时可能迁移,尤其在判断跨境流动的时机和规模方面效果明显。研究还指出,预训练语言模型最能作为早期预警工具,因为这些人工智能通过深度学习在大量文本中识别语言模式。
研究作者 Marahrens 表示,这种方法在冲突环境(例如乌克兰)表现最好,而在像委内瑞拉这样的长期经济危机中效果较差。他提醒社交媒体分析会导致误报,因此最有用的做法是将其作为触发更深入调查的信号,并与经济指标、实地报告等传统数据结合使用。研究还建议未来工作探讨情感与情绪的关系、使用自动翻译覆盖更多语言,以及纳入其他社交网络的数据。
该研究获得美国国家科学基金会和乔治城大学大数据研究所的资助。资料来源:圣母大学。
难词
- 人口迁移 — 人们从一地迁往另一地居住
- 情感标签 — 表示正面、负面或中性的标记
- 情绪标签 — 表示具体情感如愤怒或喜悦
- 预训练语言模型 — 在大量文本上训练的语言模型
- 早期预警 — 提前发现危险或变化的信号
- 误报 — 错误地报告不存在的警情
- 触发 — 引起或启动某个后续行动
提示:在文章中将鼠标悬停、聚焦或轻触高亮词语,即可在阅读或听音频时快速查看简要释义。
讨论问题
- 为什么你认为研究发现情感标签比情绪标签更能预测人口迁移?请用文章信息并说明理由。
- 如果把社交媒体分析作为早期预警工具,应如何与经济指标和实地报告结合以减少误报?举一两条具体做法。
- 文章提到该方法在冲突环境效果最好,而在长期经济危机中效果差。你认为不同类型危机对数字数据预测的可靠性有哪些影响?请说明。