ImpliHateVid: Implicit Hate Speech Detection in Videos¶

领域现状: 仇恨言论检测研究主要聚焦文本（推文、评论）和图像（meme），视频仇恨检测刚起步（如HateMM），但仅关注显性仇恨。
现有痛点: 隐性仇恨言论通过编码语言、暗示含义、上下文线索间接传达偏见，表面无害却传播伤害，现有方法难以捕捉。
核心矛盾: 视频占数字通信主导地位，但缺乏专门针对视频中隐性仇恨的数据集和检测方法。
本文要解决什么: 构建首个视频隐性仇恨检测数据集，并提出有效的多模态检测方法。
切入角度: 从BitChute和Odysee等低审核平台收集仇恨视频，通过两阶段对比学习融合多模态信息。
核心idea一句话: 通过两阶段对比学习（模态内→跨模态）加上情感和字幕特征，全面捕捉视频中隐性仇恨的多模态线索。

会议: ACL 2025
arXiv: 2508.06570
代码: GitHub
领域: NLP理解
关键词: 隐性仇恨言论, 视频内容审核, 多模态, 对比学习, 数据集

一句话总结¶

首次提出视频中隐性仇恨言论检测任务，构建2009个视频的ImpliHateVid数据集，并设计两阶段对比学习框架融合文本、图像、音频三模态特征。

预处理（提取音频/文本/视觉帧）→ImageBind特征提取（1024维）→Stage 1模态内对比学习→Stage 2跨模态对比学习→融合分类。

两阶段对比学习: Stage 1：训练三个模态特征编码器（音频/文本/图像），将三模态特征concat后通过投影头映射到共享空间，用监督对比损失优化。Stage 2：训练跨模态编码器（IT/IA/TA），进一步对齐跨模态表示。
辅助特征: 情感特征（NRCLex情感词典+VADER情感分数）和字幕特征（OFA生成图像字幕→BERT编码），补充主模态表示。
数据标注流程: 1名教授+1名博士监督，4名本科生标注。每周50个视频批次，每天不超过20个视频，10-15分钟间隔休息以保护标注者心理健康。

总损失 = Stage 1损失 + Stage 2损失 + 情感/字幕的监督对比损失。监督对比损失强制同类样本靠近、异类样本远离。

方法	ImpliHateVid Acc	ImpliHateVid F1	HateMM Acc	HateMM F1
BERT（文本）	0.691	0.688	0.735	0.664
ViT（图像）	0.766	0.768	0.748	0.672
GPT-4（视频）	0.499	0.666	0.401	0.572
MulT	0.835	0.835	0.657	0.521
CSID	0.815	0.815	0.732	0.714
本文方法	0.875	0.877	0.976	0.976