Page 318 - 《软件学报》2025年第7期
P. 318
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
2025,36(7):3239−3252 [doi: 10.13328/j.cnki.jos.007229] [CSTR: 32375.14.jos.007229] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
*
基于特征融合动态图网络的多标签文本分类算法
黄 靖 1 , 陶竹林 2 , 杜晓宇 1 , 项欣光 1
1
(南京理工大学 计算机科学与工程学院, 江苏 南京 210094)
(中国传媒大学 信息与通信工程学院, 北京 100024)
2
通信作者: 杜晓宇, E-mail: duxy@njust.edu.cn
摘 要: 多标签文本分类旨在为文本分配若干预定义的标签或类别. 为了充分发掘标签间的关联, 目前的方法通常
使用标签关系图并结合图神经网络获取标签特征表示. 然而, 这类方法过度依赖初始建图策略, 忽视了当前文本中
固有的标签相关性, 使得分类结果更依赖于数据集统计信息, 而容易忽视当前文本段中的标签相关信息. 因此, 提
出一种基于特征融合动态图网络的多标签文本分类算法, 设计动态图来建模当前文本中的标签相关性, 并结合特
征融合与图神经网络, 形成基于当前文本的标签表示, 并由此形成更为准确的多标签文本结果. 随后, 设计实验进
行验证, 在 3 个数据集实验结果表明, 所提出的模型在多标签分类任务中取得优秀的性能, 验证其有效性和可行性.
关键词: 多标签文本分类; 图卷积网络; 注意力机制; 动态图
中图法分类号: TP18
中文引用格式: 黄靖, 陶竹林, 杜晓宇, 项欣光. 基于特征融合动态图网络的多标签文本分类算法. 软件学报, 2025, 36(7):
3239–3252. http://www.jos.org.cn/1000-9825/7229.htm
英文引用格式: Huang J, Tao ZL, Du XY, Xiang XG. Multi-label Text Classification Algorithm Based on Feature-fused Dynamic
Graph Network. Ruan Jian Xue Bao/Journal of Software, 2025, 36(7): 3239–3252 (in Chinese). http://www.jos.org.cn/1000-9825/7229.
htm
Multi-label Text Classification Algorithm Based on Feature-fused Dynamic Graph Network
2
1
1
HUANG Jing , TAO Zhu-Lin , DU Xiao-Yu , XIANG Xin-Guang 1
1
(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)
2
(School of Information and Communication Engineering, Communication University of China, Beijing 100024, China)
Abstract: Multi-label text classification aims to assign several predefined labels or categories to text. To fully explore the correlations
among labels, current methods typically utilize a label relation graph and integrate it with graph neural networks to obtain the
representations of label features. However, such methods often overly rely on the initial graph construction, overlooking the inherent label
correlations in the current text. Consequently, classification results heavily depend on the statistics of datasets and may overlook label-
related information within the text. Therefore, this study proposes an algorithm for multi-label text classification based on feature-fused
dynamic graph networks. It designs dynamic graphs to model label correlations within the current text and integrates feature fusion with
graph neural networks to form label representations based on the current text, thus achieving more accurate multi-label text classifications.
Experimental results on three datasets demonstrate the effectiveness and feasibility of the proposed model as it shows excellent
performance in multi-label text classifications.
Key words: multi-label text classification; graph convolutional network (GCN); attention mechanism; dynamic graph
文本分类是自然语言处理中的一个重要任务, 旨在为句子、文档等文本分配预定义类别或标签 [1] . 随着互联
网的迅猛发展和信息爆炸式增长, 文本数据的数量和复杂性不断增加, 在此背景下, 文本分类在诸多领域得到了广
泛应用, 如专利分类 [2] 、网页标记 [3] 、推荐系统 [4] 和情感分析 [5] 等. 在实际应用中, 许多文本数据具有复杂的语义
* 基金项目: 国家自然科学基金 (62172226, 62272230); 江苏省“双创博士”人才计划 (JSSCBS20210200)
收稿时间: 2023-11-09; 修改时间: 2024-01-04, 2024-02-25; 采用时间: 2024-05-20; jos 在线出版时间: 2024-12-11
CNKI 网络首发时间: 2024-12-12

