Page 242 - 《软件学报》2025年第5期
P. 242
2142 软件学报 2025 年第 36 卷第 5 期
的帖子加入候选摘要集合.
● LexRank [72] 根据帖子之间的相似度构建相似度图, 并在图上利用类似 PageRank 的图排序算法对节点按照重
要性排序, 并迭代地抽取重要性最高的帖子加入候选摘要集合, 直至达到长度限制.
● DSDR [73] 使用基于线性重构的方法, 通过最小化重构损失寻找最优的帖子子集作为摘要.
● MDS-Sparse [74] 利用稀疏编码技术, 通过重构原始语料来识别帖子的重要性, 并抽取重要帖子作为摘要.
● PacSum [75] 是一种改进的基于图的抽取式摘要方法, 利用 BERT 对文本进行特征提取, 并同时将文档中句子
之间的相对位置建模为图中边的方向, 从而考虑了图中节点之间的方向性, 并根据节点的中心度得分抽取重要帖
子加入候选摘要集合.
[76]
● Spectral 是一种无监督多文档摘要方法. 它使用基于谱的假设, 定义了谱重要性 (spectral impact) 的概念,
通过计算每个句子的谱重要性, 抽取重要性较高的帖子作为摘要.
● MTGNN [54] 使用文帖子中更细粒度的语义单元来捕捉单词和帖子之间的复杂关系, 构建了用于产生摘要的
异构图神经网络.
第 2 种方法额外考虑了帖子之间的社交网络结构信息, 利用网络的拓扑结构来提升摘要的性能, 具体包括:
● SNSR [27] 将社交网络中的社会关系以正则项的方式融合到稀疏重构的框架中, 从而去除用户间的冗余信息,
抽取更加多样性的帖子作为摘要.
● SCMGR [53] 在原始社交网络中使用图卷积网络来提取社会化的帖子表示, 并使用稀疏重构框架来抽取摘要
帖子. 但是该方法忽略了网络中噪声关系的影响.
6 实验结果分析
6.1 主体实验结果
表 3 与表 4 分别展示了本文的 DSNSum 模型和其他对比模型在 TWEETSUM 与 Weibo 数据上的摘要性能.
第 1 部分包含了 Expert, Oracle 和 Random 这 3 种基线方法, 分别代表不同标准参考摘要之间的一致性、性能上
限和性能下限. 第 2 部分展示了仅考虑文本内容的摘要方法的评估结果, 最后一部分展示了融合社交关系的摘要
方法的性能得分. 从表 3 与表 4 中的结果可以得到以下观察.
表 3 模型以及对比方法在 TWEETSUM 上的 表 4 模型以及对比方法在 Weibo 上的
ROUGE 评估结果 ROUGE 评估结果
模型 R-1 R-2 R-L R-SU* 模型 R-1 R-2 R-L R-SU*
Oracle 58.229 34.902 56.688 29.940 Oracle 42.024 18.577 18.409 16.511
Expert 47.384 15.972 45.111 21.047 Expert 47.139 25.289 28.535 20.556
Random 41.480 9.671 0 39.149 16.408 Random 32.880 7.874 0 12.504 10.483
Centroid 38.172 12.442 36.430 15.409 Centroid 29.712 7.958 0 13.718 9.741 0
LSA 43.524 13.077 41.347 18.197 LSA 29.181 8.375 0 12.717 8.902 0
LexRank 42.132 13.302 39.965 18.192 LexRank 34.802 8.100 0 12.762 11.593
DSDR 43.335 13.106 41.055 17.264 DSDR 19.771 5.362 0 8.679 0 4.588 0
MDS-Sparse 42.119 10.059 40.101 16.686 MDS-Sparse 33.019 7.562 0 12.599 10.621
PacSum 42.603 13.021 40.375 17.268 PacSum 32.664 8.760 0 13.554 10.811
Spectral 43.488 11.980 41.229 17.794 Spectral 33.862 8.657 0 12.842 11.260
MTGNN 44.852 12.481 42.102 20.013 MTGNN 33.762 8.219 13.558 11.519
SNSR 44.886 13.891 42.800 19.990 SNSR 34.009 7.622 0 12.566 10.925
SCMGR 45.829 14.081 43.433 20.141 SCMGR 36.405 10.495 14.469 12.722
DSNSum (本文模型) 46.506 14.285 44.157 20.757 DSNSum (本文模型) 37.014 10.975 14.224 13.060
(1) 本文的 DSNSum 模型在 TWEETSUM 数据集上全面超过了其他对比模型, 并且在 Weibo 数据上取得了具
有竞争力的实验结果, 证明了本文模型的有效性. 由于 SCMGR 模型在对比模型中取得了较高的得分, 实验中对
DSNSum 与 SCMGR 的实验结果进行了显著性检验, 结果显示, 除在 Weibo 数据上的 ROUGE-L 得分之外, 所有结