Page 320 - 《软件学报》2025年第7期
P. 320

黄靖 等: 基于特征融合动态图网络的多标签文本分类算法                                                     3241


                 制  (cs.SY) 和机器自动化  (cs.RO) 有关, 这是静态图难以描述的, 需要根据文档动态扩充. 但在图                 1(b) 中描述的文
                 档中正好相反, 它仅包含       texture classification、image processing、color images 等与人工智能  (cs.AI) 和计算机视
                 觉  (cs.CV) 相关的关键词, 对其余标签并不相关, 需要削弱无关关系的关联.
                    针对上述问题, 本文提出了一种基于特征融合动态图网络的多标签文本分类算法                           (multi-label text classification
                 via feature-fused dynamic graph network, FDGN), 皆在通过分析当前待分类文本形成更优的个性化标签特征. 详细
                 来说, FDGN  基于当前文本中存在的标签相关性构造动态图, 以期能够降低数据集统计偏差的影响, 准确反映标签
                 之间的关联关系. FDGN      在动态图的基础上, 设计基于当前文本的特征融合模块, 运用图神经网络生成标签的增强
                 语义表示, 综合文本上下文信息, 提升标签预测的效果.
                    本文的主要贡献如下.
                    (1) 设计动态图模块, 根据当前文本上下文动态调整标签之间的关联性. 与传统的静态图相比, 动态图能够更
                 准确地捕捉标签的语义信息, 使得所提出的模型在处理复杂多样的文本数据时更具优势.
                    (2) 设计全局与局部特征融合模块, 综合不同层次和角度的特征信息, 提高对标签的预测能力. 有效融合多个
                 信息源, 能够更全面地理解文本的语义内容, 从而提高多标签分类的准确性.
                    (3) 设计实验评估所提算法, 在       3  个基准数据集上进行实验, 验证了提出的方法的有效性. 实验结果表明, 本文
                 的方法在很大程度上优于基线算法, 证明了其在多标签文本分类任务中的优越性和可行性.

                 1   相关工作

                 1.1   多标签文本分类
                    在过去的几十年里, 已经提出了许多用于多标签文本分类的方法. 总的来说, 这些方法聚焦于提取增强文本表
                 示和建模标签关系这两方面上.
                    在提取增强文本表示上, 早期的方法主要依赖于手工提取特征                     (如词袋模型、TF-IDF    等), 然后使用机器学习
                 算法进行分类     [14−16] . 虽然这些传统方法在文本分类任务中取得了一定成就, 但它们对于复杂语义和长文本的处理
                 效果有限. 随着深度学习技术的发展, 基于神经网络的方法成为研究的主方向                        [17−22] , 包含卷积神经网络  CNN、循
                 环神经网络     RNN、注意力模型       BERT  等. 目前已经提出了许多用于多标签文本分类的深度学习模型, 如
                 TextCNN [23] 、TopicRNN [24] 、HAN [25] 等. 这些深度学习方法能够学习丰富的文本语义表示, 显著提高多标签文本
                 分类的性能. 然而, 这些方法侧重于提取文本表示, 没有考虑到标签和文本之间的交互关系. 肖琳等人                             [26] 注意到这
                 个问题, 利用标签语义注意力机制捕获每个标签关注的单词, 为每个标签学习一个标签相关的文本表示. 该方法虽
                 然通过在文本中提取标签相关的文本信息进而考虑了标签与文本之间的关系, 但忽视了标签之间的关系.
                    在建模标签关系上, 早期的方法主要基于链式规则和序列生成算法. Read                      等人  [27] 使用链式规则来进行分类,
                 将前一个分类器的输出作为后一个分类器的输入, 每个分类器都可以考虑前面的标签作为上下文, 从而能够捕捉
                 标签之间的关联. Nam     等人  [28] 将标签组合视为序列, 将多标签任务转变为一个标签序列生成任务, 通过递归神经
                 网络来进行分类. 但是这类方法对于标签顺序较敏感, 不适合关系复杂的场景. 为了解决这个问题, 基于图神经网
                 络的方法被提出. 这类方法通过构建标签之间的关系图                  (如标签共现图、标签依赖图), 然后将标签表示通过图上
                 的边进行传递和聚合, 通过学习到信息更为丰富的标签表示来提升长尾标签的预测效果. Ozmen                            等人  [29] 基于推拉
                 关系设计了一个多关系图, 通过多关系神经网络               (CompGCN [30] ) 来建模标签之间的推拉关系.

                 1.2   注意力机制
                    在自然语言处理任务中, 注意力机制能够帮助模型关注输入文本中与当前预测有关的词语或片段, 从而提取
                 更重要的语义信息. 在多标签文本分类任务当中, 注意力机制允许模型集中关注输入文本中与特定标签相关的关
                 键信息, 从而提高分类的准确性和效率            [31] . 近年来, 一些研究基于注意力机制来探索标签和文档之间的语义联系,
                 它们将深度学习模型与注意力机制相结合, 以提高模型的效率. 肖琳等人                      [26] 利用交叉注意力机制从文档内容信息
                 中提取标签特定的文档表示, 可以更好地学习标签的表示. Guo                  等人  [32] 将注意力机制与    CNN-RNN  模型相结合,
   315   316   317   318   319   320   321   322   323   324   325