Narrative Media Framing in Political Discourse¶
会议: ACL 2025
arXiv: 2506.00737
代码: 有 (GitHub)
领域: NLP / 计算社会科学
关键词: 叙事框架, 媒体分析, 政治话语, LLM, 气候变化
一句话总结¶
将叙事学理论与媒体框架分析相结合,提出了包含角色(英雄/反派/受害者)、冲突/解决、文化故事三个结构化组件的叙事框架分析体系,在气候变化和 COVID-19 两个领域验证了该框架的有效性和可迁移性。
研究背景与动机¶
叙事框架(Narrative Framing)是媒体报道中一种强大的修辞手段——通过讲述"故事"的方式来引导读者对复杂议题的理解和判断。例如,同样是报道气候变化,一篇文章可以将环保活动家塑造为"英雄",也可以将其塑造为"反派",由此传递截然不同的信息。
现有 NLP 中的框架分析(framing analysis)主要以话题式框架(topic-like frames)为主,如"经济框架""冲突框架"等,但这种分类过于粗糙,无法捕捉同一话题下不同叙事策略的细微差异。例如,两篇同属"经济框架"的气候变化文章,一篇可能在强调化石燃料的经济必要性,另一篇则在呼吁气候行动的经济效益——它们的叙事方向完全相反。
NLP 领域虽然有对叙事元素(如角色、事件)的研究,但这些研究要么是领域特定的,要么缺少与框架分析的核心机制(议题歧义性、模式激活)的联系。本文通过整合叙事政策框架(Narrative Policy Framework, NPF)和 Entman 的框架理论,构建了一个结构化、可操作化的叙事框架分析体系。
方法详解¶
整体框架¶
提出三个核心组件,共同定义一个叙事框架:
- 角色(Characters):谁是英雄、反派、受害者?焦点在哪个角色上?
- 冲突与解决(Conflict & Resolution):角色是在激化冲突还是推动解决?
- 文化故事(Cultural Stories):文章映射到哪种更宏观的文化价值观?
关键设计¶
1. 角色系统 (Hero/Villain/Victim)¶
核心思路:通过给实体分配原型角色(英雄/反派/受害者)来消解议题歧义性。读者对文章的解读取决于特定实体被框架为英雄(其行为被评价为有益)、反派(有害)还是受害者。
设计要点: - 区分主要角色和次要提及的实体,每个角色类型只取最核心的一个实体 - 将具体人物/组织抽象为利益相关者类别(如政府、环保活动家、普通民众等),使得跨文本比较成为可能 - 引入焦点(focus)概念:即使两篇文章的英雄和反派相同,焦点不同则叙事框架不同——"英雄式"(heroic)聚焦赞扬英雄,"责备式"(blaming)聚焦批评反派
2. 冲突与解决¶
将角色的行为定义为四种态度: - 激化冲突(fuel conflict):做出加剧问题的行为 - 推动解决(fuel resolution):做出解决问题的行为 - 阻止冲突(prevent conflict):反对加剧问题的行为 - 阻止解决(prevent resolution):反对解决问题的行为
这种抽象化使得该组件可以跨领域迁移——不需要定义特定的事件或行为,只需要判断态度方向。
3. 文化故事¶
基于 Douglas (2007) 的文化理论,将叙事映射到四种文化价值观: - 宿命主义(fatalist):人们受到不可控力量的摆布 - 等级主义(hierarchical):人们受社会规范和外部控制约束(如政府) - 个人主义(individualistic):社会联系松散,不需要外部控制 - 平等主义(egalitarian):集体行动,反对外部控制
标注流程与数据¶
- 从 1,000+ 美国气候变化新闻文章中随机选取 100 篇进行人工标注
- 通过组件式标注(先标注角色、焦点、冲突、文化故事,再映射到叙事框架),比直接选择叙事标签的标注一致性高得多(63% vs 37%)
- 最终定义了 16 种结构不同的叙事框架
实验关键数据¶
主实验:LLM 零样本叙事框架预测¶
| 任务 | GPT-4o | o1 | Mixtral | Llama | Gemini | Sonnet | Baseline |
|---|---|---|---|---|---|---|---|
| Hero (10类) | 0.325 | 0.363 | 0.237 | 0.271 | 0.326 | 0.353 | 0.079 |
| Villain (10类) | 0.454 | 0.527 | 0.073 | 0.156 | 0.292 | 0.530 | 0.080 |
| Focus (3类) | 0.656 | 0.718 | 0.402 | 0.568 | 0.635 | 0.688 | 0.231 |
| Conflict (4类) | 0.332 | 0.549 | 0.353 | 0.379 | 0.361 | 0.399 | 0.135 |
| Cultural Story (4类) | 0.574 | 0.595 | 0.431 | 0.449 | 0.482 | 0.561 | 0.190 |
| Narrative (16类) | 0.258 | 0.330 | 0.171 | 0.181 | 0.319 | 0.339 | 0.021 |
(指标为 Macro F1)
消融实验:加入结构标签对叙事框架预测的影响¶
| 模型 | 无结构 | + 预测标签 | + Oracle 标签 |
|---|---|---|---|
| GPT-4o | 0.258 | ~0.40 | ~0.55 |
| Gemini | 0.319 | ~0.33 | ~0.43 |
| Sonnet | 0.339 | ~0.38 | ~0.45 |
关键发现¶
- 没有单一模型在所有任务上表现最好:Sonnet 和 o1 总体最强,但各有优劣
- 结构化信息显著提升叙事预测:加入角色/焦点等结构标签后,GPT-4o 的 F1 从 0.258 升至约 0.55(oracle=约 0.55),提升幅度远超模型推理能力本身的提升
- 叙事框架 vs 通用框架存在弱相关:同一通用框架(如"经济")可以对应多种不同叙事框架,说明叙事分析提供了更细粒度的洞察
- 政治倾向与叙事组件强关联:右倾媒体压倒性地使用"阻止解决"和"个人主义文化故事",这些模式在左倾媒体中完全不出现
- 跨领域可迁移:在 COVID-19 政治演讲上的无监督应用结果与已有政治学分析一致,验证了框架的通用性
亮点与洞察¶
- 从社会科学到 NLP 的桥梁构建:将 NPF(叙事政策框架)操作化为可计算的组件,这种理论驱动的研究路径比纯数据驱动更有深度
- 组件式标注的智慧:将复杂的 16 类叙事框架分解为 3-10 类的子任务进行标注,大幅降低认知负担并提升标注一致性——这种方法论对其他复杂标注任务也有参考价值
- 结构 > 推理能力:实验表明,给模型提供结构化标签比使用更强大的推理模型(如 o1)更有效,这对 prompt engineering 有重要启示
- COVID-19 分析的发现:Morrison 偏好等级主义叙事(政府主导),Merkel 偏好平等主义叙事(集体行动),Johnson 是唯一使用个人主义叙事的,这些发现与政治学文献高度一致
局限与展望¶
- 数据集仅 100 篇(标注深度优先于广度),规模较小
- LLM 在 16 类叙事框架直接预测上表现较差(即使减少为 3 类也提升有限),有较大改进空间
- 目前仅在零样本设定下评估,few-shot 和微调方向未深入探索
- 仅覆盖美国英文媒体,跨语言、跨文化的叙事框架分析是重要方向
- 文化故事组件尚未被纳入结构化 prompt 中(仅用了角色和焦点),未来可以进一步完善
相关工作与启发¶
- Narrative Policy Framework (NPF) 提供了政治叙事分析的理论基础
- Entman (1993) 的框架理论定义了框架的四个功能(问题定义、原因归因、道德评价、解决建议)
- Douglas 的文化理论 (Grid-Group Cultural Theory) 提供了将叙事映射到宏观价值观的方法
- 与纯数据驱动的 NLP 框架分析方法相比,本文的理论驱动路径更适合处理复杂的社会科学问题
评分¶
- 新颖性: ⭐⭐⭐⭐⭐ — 首次将叙事框架的三个核心组件形式化并操作化,理论深度和实用性兼备
- 实验充分度: ⭐⭐⭐⭐ — 6 个 LLM × 7 个任务的全面评估,加上跨领域验证,但数据集偏小
- 写作质量: ⭐⭐⭐⭐⭐ — 理论阐述深入,框架设计逻辑清晰,跨学科整合出色
- 价值: ⭐⭐⭐⭐ — 对计算社会科学和政治传播学有重要参考价值,框架具有广泛的应用前景
相关论文¶
- [ACL 2025] Entity Framing and Role Portrayal in the News
- [ACL 2025] Temporal Reasoning for Timeline Summarisation in Social Media
- [ACL 2025] Graphically Speaking: Unmasking Abuse in Social Media with Conversation Insights
- [ACL 2025] Meaning Beyond Truth Conditions: Evaluating Discourse Level Understanding via Anaphora Accessibility
- [ACL 2025] Behind Closed Words: Creating and Investigating the forePLay Annotated Dataset for Polish Erotic Discourse