Page 318 - 《软件学报》2025年第7期
P. 318

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
                 2025,36(7):3239−3252 [doi: 10.13328/j.cnki.jos.007229] [CSTR: 32375.14.jos.007229]  http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563



                                                                            *
                 基于特征融合动态图网络的多标签文本分类算法

                 黄    靖  1 ,    陶竹林  2 ,    杜晓宇  1 ,    项欣光  1


                 1
                  (南京理工大学 计算机科学与工程学院, 江苏 南京 210094)
                  (中国传媒大学 信息与通信工程学院, 北京        100024)
                 2
                 通信作者: 杜晓宇, E-mail: duxy@njust.edu.cn

                 摘 要: 多标签文本分类旨在为文本分配若干预定义的标签或类别. 为了充分发掘标签间的关联, 目前的方法通常
                 使用标签关系图并结合图神经网络获取标签特征表示. 然而, 这类方法过度依赖初始建图策略, 忽视了当前文本中
                 固有的标签相关性, 使得分类结果更依赖于数据集统计信息, 而容易忽视当前文本段中的标签相关信息. 因此, 提
                 出一种基于特征融合动态图网络的多标签文本分类算法, 设计动态图来建模当前文本中的标签相关性, 并结合特
                 征融合与图神经网络, 形成基于当前文本的标签表示, 并由此形成更为准确的多标签文本结果. 随后, 设计实验进
                 行验证, 在  3  个数据集实验结果表明, 所提出的模型在多标签分类任务中取得优秀的性能, 验证其有效性和可行性.
                 关键词: 多标签文本分类; 图卷积网络; 注意力机制; 动态图
                 中图法分类号: TP18


                 中文引用格式: 黄靖,  陶竹林,  杜晓宇,  项欣光.  基于特征融合动态图网络的多标签文本分类算法.  软件学报,  2025,  36(7):
                 3239–3252. http://www.jos.org.cn/1000-9825/7229.htm
                 英文引用格式: Huang  J,  Tao  ZL,  Du  XY,  Xiang  XG.  Multi-label  Text  Classification  Algorithm  Based  on  Feature-fused  Dynamic
                 Graph Network. Ruan Jian Xue Bao/Journal of Software, 2025, 36(7): 3239–3252 (in Chinese). http://www.jos.org.cn/1000-9825/7229.
                 htm

                 Multi-label Text Classification Algorithm Based on Feature-fused Dynamic Graph Network
                                      2
                           1
                                                 1
                 HUANG Jing , TAO Zhu-Lin , DU Xiao-Yu , XIANG Xin-Guang 1
                 1
                 (School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)
                 2
                 (School of Information and Communication Engineering, Communication University of China, Beijing 100024, China)
                 Abstract:  Multi-label  text  classification  aims  to  assign  several  predefined  labels  or  categories  to  text.  To  fully  explore  the  correlations
                 among  labels,  current  methods  typically  utilize  a  label  relation  graph  and  integrate  it  with  graph  neural  networks  to  obtain  the
                 representations  of  label  features.  However,  such  methods  often  overly  rely  on  the  initial  graph  construction,  overlooking  the  inherent  label
                 correlations  in  the  current  text.  Consequently,  classification  results  heavily  depend  on  the  statistics  of  datasets  and  may  overlook  label-
                 related  information  within  the  text.  Therefore,  this  study  proposes  an  algorithm  for  multi-label  text  classification  based  on  feature-fused
                 dynamic  graph  networks.  It  designs  dynamic  graphs  to  model  label  correlations  within  the  current  text  and  integrates  feature  fusion  with
                 graph  neural  networks  to  form  label  representations  based  on  the  current  text,  thus  achieving  more  accurate  multi-label  text  classifications.
                 Experimental  results  on  three  datasets  demonstrate  the  effectiveness  and  feasibility  of  the  proposed  model  as  it  shows  excellent
                 performance in multi-label text classifications.
                 Key words:  multi-label text classification; graph convolutional network (GCN); attention mechanism; dynamic graph

                    文本分类是自然语言处理中的一个重要任务, 旨在为句子、文档等文本分配预定义类别或标签                                 [1] . 随着互联
                 网的迅猛发展和信息爆炸式增长, 文本数据的数量和复杂性不断增加, 在此背景下, 文本分类在诸多领域得到了广
                 泛应用, 如专利分类     [2] 、网页标记  [3] 、推荐系统  [4] 和情感分析  [5] 等. 在实际应用中, 许多文本数据具有复杂的语义


                 *    基金项目: 国家自然科学基金  (62172226, 62272230); 江苏省“双创博士”人才计划  (JSSCBS20210200)
                  收稿时间: 2023-11-09; 修改时间: 2024-01-04, 2024-02-25; 采用时间: 2024-05-20; jos 在线出版时间: 2024-12-11
                  CNKI 网络首发时间: 2024-12-12
   313   314   315   316   317   318   319   320   321   322   323