Page 352 - 《软件学报》2025年第12期
P. 352
余建兴 等: 基于常识推理问答的多模态题文不符检测 5733
成火龙果对降低血压有极大功效的假象. 针对这篇推文, 使用我们的方法检索了一系列上下文和常识事实的三元
组, 并以此作为线索来构建多个子提问. 基于先验推理结构, 我们组装成复杂具有常识推理能力的提问. 这个组合
过程是可控的, 所生成提问的推理步骤数随着轮数增加而递增, 每个提问都从一个新角度验证潜在的题文不符方
面. 我们展示了不一致得分最高的提问. 要回答这个复杂提问, 需要对多个事实进行推理, 例如水果中含有钾元素、
钾是一类矿物质元素以及钾元素对降低血压有功效. 根据推文中的上下文内容和外部开放域的知识, 我们的模型
分别得出两个答案. 通过比较它们可以找出不一致之处, 从而更好地帮助检测器做出正确判断, 还可以对决策给出
合理的解释.
它是 “降压之王”, 睡前吃一个60岁血管都通畅
含有 功效
水果 钾元素 降血压
开放域 QA
矿物质 包含
闭域 QA 铬元素 题文不符
不一致
图 7 本文方法判断题文不符推文的案例展示
4 总 结
本文旨在检测社交媒体平台上传播的题文不符推文. 这些推文各组成部分内容通常存在不一致, 例如用与推
文内容不符的封面图来诱惑用户点击, 这会损害用户体验. 此外, 这些推文会使用窍门进行伪装, 以规避检测系统.
这项任务具有挑战性, 需要对推文细节全方位分析, 甚至借助外部常识才能推断潜在的不一致. 现有方法大多基于
神经网络, 这种黑匣子框架的推理能力和可解释性较弱. 为了解决这个问题, 我们提出了提问-验证的检测框架. 具
体来说, 我们首先使用多模态检索增强技术来收集与推文相关的各类潜在线索. 然后, 我们可控地生成一系列相关
提问来质疑每个线索, 并通过解答这些提问来验证线索的真实性. 与简单的基于匹配的提问不同, 我们方法生成的
提问具备多跳常识推理能力, 它们有助于灵活地检查复杂且隐式的虚假事实和不一致关系. 通过多知识源多维交
叉验证答案的可靠性, 我们可以发现推文中的虚假、伪装等不一致内容, 并为预测结果提供可解释的推理过程.
在 3 个数据集上进行的充分的实验, 结果表面了本方法的有效性.
References:
[1] Indurthi V, Syed B, Gupta M, Varma V. Predicting clickbait strength in online social media. In: Proc. of the 28th Int’l Conf. on
Computational Linguistics. Barcelona: International Committee on Computational Linguistics, 2020. 4835–4846. [doi: 10.18653/v1/2020.
coling-main.425]
[2] Ecker UKH, Lewandowsky S, Chang EP, Pillai R. The effects of subtle misinformation in news headlines. Journal of Experimental
Psychology: Applied, 2014, 20(4): 323–335. [doi: 10.1037/xap0000028]

