Page 242 - 《软件学报》2025年第5期
P. 242

2142                                                       软件学报  2025  年第  36  卷第  5  期


                 的帖子加入候选摘要集合.
                    ● LexRank [72] 根据帖子之间的相似度构建相似度图, 并在图上利用类似              PageRank  的图排序算法对节点按照重
                 要性排序, 并迭代地抽取重要性最高的帖子加入候选摘要集合, 直至达到长度限制.
                    ● DSDR [73] 使用基于线性重构的方法, 通过最小化重构损失寻找最优的帖子子集作为摘要.
                    ● MDS-Sparse [74] 利用稀疏编码技术, 通过重构原始语料来识别帖子的重要性, 并抽取重要帖子作为摘要.
                    ● PacSum [75] 是一种改进的基于图的抽取式摘要方法, 利用           BERT  对文本进行特征提取, 并同时将文档中句子
                 之间的相对位置建模为图中边的方向, 从而考虑了图中节点之间的方向性, 并根据节点的中心度得分抽取重要帖
                 子加入候选摘要集合.
                            [76]
                    ● Spectral  是一种无监督多文档摘要方法. 它使用基于谱的假设, 定义了谱重要性 (spectral impact) 的概念,
                 通过计算每个句子的谱重要性, 抽取重要性较高的帖子作为摘要.
                    ● MTGNN  [54] 使用文帖子中更细粒度的语义单元来捕捉单词和帖子之间的复杂关系, 构建了用于产生摘要的
                 异构图神经网络.
                    第  2  种方法额外考虑了帖子之间的社交网络结构信息, 利用网络的拓扑结构来提升摘要的性能, 具体包括:
                    ● SNSR [27] 将社交网络中的社会关系以正则项的方式融合到稀疏重构的框架中, 从而去除用户间的冗余信息,
                 抽取更加多样性的帖子作为摘要.
                    ● SCMGR [53] 在原始社交网络中使用图卷积网络来提取社会化的帖子表示, 并使用稀疏重构框架来抽取摘要
                 帖子. 但是该方法忽略了网络中噪声关系的影响.

                 6   实验结果分析

                 6.1   主体实验结果
                    表  3  与表  4  分别展示了本文的    DSNSum  模型和其他对比模型在        TWEETSUM   与  Weibo  数据上的摘要性能.
                 第  1  部分包含了  Expert, Oracle 和  Random  这  3  种基线方法, 分别代表不同标准参考摘要之间的一致性、性能上
                 限和性能下限. 第     2  部分展示了仅考虑文本内容的摘要方法的评估结果, 最后一部分展示了融合社交关系的摘要
                 方法的性能得分. 从表      3  与表  4  中的结果可以得到以下观察.

                    表 3 模型以及对比方法在 TWEETSUM          上的              表 4 模型以及对比方法在 Weibo        上的
                               ROUGE  评估结果                                  ROUGE  评估结果

                       模型          R-1   R-2    R-L  R-SU*          模型          R-1   R-2    R-L  R-SU*
                       Oracle     58.229  34.902  56.688  29.940    Oracle     42.024  18.577  18.409  16.511
                       Expert     47.384  15.972  45.111  21.047    Expert     47.139  25.289  28.535  20.556
                      Random      41.480  9.671 0  39.149  16.408  Random      32.880  7.874 0  12.504  10.483
                      Centroid    38.172  12.442  36.430  15.409   Centroid    29.712  7.958 0  13.718  9.741 0
                       LSA        43.524  13.077  41.347  18.197    LSA        29.181  8.375 0  12.717  8.902 0
                      LexRank     42.132  13.302  39.965  18.192   LexRank     34.802  8.100 0  12.762  11.593
                       DSDR       43.335  13.106  41.055  17.264    DSDR       19.771  5.362 0  8.679 0  4.588 0
                     MDS-Sparse   42.119  10.059  40.101  16.686  MDS-Sparse   33.019  7.562 0  12.599  10.621
                      PacSum      42.603  13.021  40.375  17.268   PacSum      32.664  8.760 0  13.554  10.811
                      Spectral    43.488  11.980  41.229  17.794   Spectral    33.862  8.657 0  12.842  11.260
                      MTGNN       44.852  12.481  42.102  20.013   MTGNN       33.762  8.219  13.558  11.519
                       SNSR       44.886  13.891  42.800  19.990    SNSR       34.009  7.622 0  12.566  10.925
                      SCMGR       45.829  14.081  43.433  20.141   SCMGR       36.405  10.495  14.469  12.722
                  DSNSum (本文模型)   46.506  14.285  44.157  20.757  DSNSum (本文模型)  37.014  10.975  14.224  13.060
                    (1) 本文的  DSNSum  模型在  TWEETSUM   数据集上全面超过了其他对比模型, 并且在             Weibo  数据上取得了具
                 有竞争力的实验结果, 证明了本文模型的有效性. 由于                 SCMGR  模型在对比模型中取得了较高的得分, 实验中对
                 DSNSum  与  SCMGR  的实验结果进行了显著性检验, 结果显示, 除在            Weibo  数据上的  ROUGE-L  得分之外, 所有结
   237   238   239   240   241   242   243   244   245   246   247