Page 341 - 《软件学报》2025年第12期
P. 341
5722 软件学报 2025 年第 36 卷第 12 期
常识却推理出另一个答案 2. 这种矛盾表明推文中存在不实内容, 属于题文不符. 这种质疑和双重验证的方式不但
可以实现高效的判断, 还能向用户展示其判断过程, 解释引起题文不符的原因. 受此启发, 我们提出通过问和答的
技术来模拟人类的这种质疑-验证的过程, 从而提高检测器的准确性和可解释性. 然而, 如何提出一个切中要害的
问题很关键, 但却不容易. 一个好提问可以加速不一致线索的发现, 而低质量提问则会陷入无效的验证中. 现有方
法往往根据发问相关的内容直接转换或者映射出对应的提问. 对应的答案通常是给定文本中的片段, 可以通过直
接匹配获得 [9] . 这些简单提问仅能验证单步的虚假关系, 难以识别复杂且伪装的题文不符情况. 这些复杂推文经常
涉及语境中多个事物之间、内部和外部常识之间、多跳间接关系之间的不一致. 这迫切需要可以生成复杂提问的
方法. 考虑到题文不符推文的鉴别难度有差异, 还需对复杂提问的推理难度进行精细化控制. 此外, 传统方法主要
是围绕文本内容进行发问, 难以检测图像和文本等跨模态之间的矛盾点. 为此, 我们需要根据推文的多模态内容构
建高阶的常识推理提问. 这些提问不但难度可控, 而且有广泛的覆盖度, 既涉及推文语境的理解, 还能应对需要外
部常识验证的场景.
与推文内容相关的问题
封闭域 开放域
回答 回答
Tom Wagg
实习于 发现 年龄
基尔大学 WASP-142b 15岁
命名
答案1: 答案2:
不一致 题文不符
图 1 存在虚假和不一致内容的题文不符推文
为了应对这些挑战, 本文提出一种基于问答引导的题文不符检测框架. 该框架通过生成一系列与推文相关且
难度可控的优质提问, 以质疑-验证的方式来发现虚假和不一致内容. 具体地, 我们首先使用检索增强技术提取出
推文中图、文等不同种模态内容的相关线索, 以此在统一模态下进行质疑验证. 然后, 利用发问模板将这些线索转
换成符合语法规范的基础子提问. 随后, 通过迭代的方式把这些子提问组装成更复杂的提问. 提问的难度由推理步
数决定. 通过增加推理步骤数, 就能形成更长的推理链. 这种组合方式不仅能增强生成过程的可解释性, 还能实现
对生成结果推理难度的定量控制. 其中复杂提问的组装是借助大语言模型 (large language model, LLM) 强大的低
资源学习能力来实现. 为了提升提问的多样性, 我们构造了示例池, 并在组装时从示例池中选取不同示例来构成多
样的提示. 把这些提示输入 LLM 就可以生成多个结果. 此外, 我们设计校验器对生成结果的质量进行评估, 从而筛
除因错误传递等原因产生的低质量提问. 针对每个通过质量校验的提问, 我们分别根据推文内容和开放域知识进
行解答和交叉验证. 当两类答案不相符时, 推文可能存在虚假内容. 这种不一致作为一种有效的特征, 可以与其他
推文的多模态特征融合来提升检测模型的判别性能. 此外, 当发现题文不符时, 我们可以列举出对应的质疑提问和
验证答案, 为判别过程提供可解释性. 在 3 个流行数据集上的大量实验验证了方法的有效性.

