Page 358 - 《软件学报》2025年第10期
P. 358

刘一丁 等: 针对   LLM  对话属性情感理解的多代理一致性反思                                              4755


                    本文认为该任务目前存在两大挑战: (1) 对话场景存在的两个重要映射关系, 分别是对话属性实体和观
                 点描述语之间的映射        (属性情感映射), 以及对话属性实体与其指代之间的映射                    (属性指代映射), 能否有效地
                 捕捉这两个映射关系决定着模型性能的好坏. (2) LLM                在处理不同任务时存在固有的幻觉现象                [8,9] , 模型在生
                 成过程中常常会出现幻觉导致模型输出的结果与我们期望不一致. 这两大挑战严重制约对话属性情感理解
                 的性能.
                    为了解决上述挑战, 本文提出多代理一致性反思方法                  (multi-agent consistency reflection approach, MACR). 该
                 方法首先设计了      3  个子任务代理, 通过多代理的方式帮助模型捕捉对话场景下的这两个映射关系, 之后为了缓解
                 大模型的幻觉问题, 该方法设计了一致性增强的反思模块, 该模块通过让模型通过评估情感理解任务和任务代理
                 的一致性来让模型进行反思, 从而让模型生成正确的结果. 具体来说, 我们的方法首先从任务的角度出发, 基于大
                 语言模型对话属性情感理解任务设计出              3  个子任务代理, 通过让模型对子任务进行学习来提升模型在大语言模型
                 对话属性情感理解任务上的性能, 3           个任务代理的抽取目标如图          1  所示. 此外, 我们提出了一致性反思方法, 该方
                 法采用强化学习的思想, 首先根据情感理解任务和子任务代理的结果得到奖励值, 当奖励值低于设定好的阈值时
                 让模型进行反思, 通过反思促使模型生成正确的结果. 我们在标注好的数据集上评估了                            MACR  的有效性, 实验结
                 果与分析表明: MACR     的性能显著超过目前主流的基准方法.
                    综上所述, 本文的主要贡献有以下           3  点.
                    (1) 为了捕捉对话中的属性指代映射和属性情感映射, 本文提出了大语言模型对话属性情感理解任务, 该任务
                 旨在利用大语言模型抽取包含属性指代映射关系和属性情感映射关系的四元组. 为了评估该任务, 我们标注了一
                 个高质量的对话属性情感理解四元组数据集.
                    (2) 为了解决对话情感理解任务中的两个挑战, 本文提出了多代理一致性反思方法, 该方法首先设计了                              3  个子
                 任务代理, 通过让模型对子任务进行学习提升模型在情感理解任务上的性能. 其次提出了一致性增强的反思模块,
                 该方法通过分析子任务代理和情感理解任务上的一致性让模型进行反思, 从而促使模型生成一致的结果.
                    (3) 本文通过实验验证了       MACR  的有效性, MACR   相较于其他基准方法具有最优的对话属性指代关系抽取和
                 属性情感抽取能力, 这将有力地促进大语言模型在对话结构下的细粒度情感理解方面的研究.

                  1   相关工作

                  1.1   属性级情感理解
                    属性级情感理解又称为属性级情感分析. 该任务是一种细粒度的情感分析任务, 旨在对文本中的属性实体、
                 观点描述语、情感极性以及它们之间的关系进行提取. 从任务形式来看, ABSA                       任务衍生出了很多工作, 这些工作
                 定义了不同的抽取对象        [2,3,10] . 例如  ASTE 提出了一个三元组抽取任务, 抽取文本中属性词、观点描述语以及情感
                                                [2]
                 极性. ASQP [11] 提出了一个四元组抽取任务, 抽取文本中属性词、属性词的种类、观点描述语和情感极性. 但上述
                 工作均基于普通文本, 但在现实中对话场景更为普遍, 近些年很多研究人员注意到了这一问题, 提出了基于对话文
                 本的  ABSA  任务. 例如  DiaASQ 从微博评论中构建了一个对话数据集并从中提取目标, 属性, 观点描述语和情感
                                         [6]
                               [5]
                 极性四元组. CASA 构建了一个对话数据集并从中提取观点描述语, 情感极性以及相应的属性词.
                    从任务方法来看, 之前很多研究采用序列标注进行处理                   ABSA  任务  [6,12] . 随着 T5  [13] 等生成模型的提出, 许多
                 研究  [14,15] 开始尝试通过生成方式直接完成抽取任务. 目前解决            ABSA  任务的方法主要分为两类: 基于序列的方法
                 以及基于生成模型的方法.
                    基于序列的方法将        ABSA  任务转化为序列标注任务或者通过特殊的标记来抽取结果. Xu                     等人  [16] 扩展了
                 BIOES  标记, 在  B  标签以及  S  标签中添加了位置信息. Wang     等人  [17] 将双向强化注意力模块作为解码器来捕捉上
                 下文中实体之间的关系. Li 等人        [18] 注意到当模型遇到属性词有多个观点描述语的问题时, 处理                ASTE  任务的方法
                 可能发生混乱, 为此该工作设计了一个方法对属性词、观点描述语以及对应的情感极性单独进行抽取. Chen 等人                                [19]
                 注意到之前的方法忽略了词与词之间的关系, 因此他们设计了增强多通道的图卷积网络模型, 通过加入图卷积网
   353   354   355   356   357   358   359   360   361   362   363