Page 87 - 《软件学报》2021年第12期
P. 87

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
         Journal of Software,2021,32(12):3751−3767 [doi: 10.13328/j.cnki.jos.006102]   http://www.jos.org.cn
         ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563


                                                         ∗
         基于 GAT2VEC 的 Web 服务分类方法

                                1,2
               1,2
                                         1,2
                       1,2
         肖   勇 ,   刘建勋 ,   胡   蓉 ,   曹步清 ,   曹应成  1,2
         1
          (服务计算与软件服务新技术湖南省重点实验室(湖南科技大学),湖南  湘潭  411201)
         2 (湖南科技大学  计算机科学与工程学院,湖南  湘潭  411201)
         通讯作者:  刘建勋, E-mail:ljx529@gmail.com

         摘   要:  随着 SOA 技术的发展,Web 服务被广泛应用,服务数量增长迅速.正确高效地对 Web 服务进行分类,对于提
         高服务发现质量、促进服务组合效率非常重要.然而,现有的 Web 服务分类技术存在描述文本稀疏、未充分考虑属
         性信息以及结构关系等问题,难以有效提升 Web 服务分类的精度.针对此问题,提出一种基于 GAT2VEC 的 Web 服务
         分类方法.首先,针对 Web 服务之间的结构关系和自身的属性信息分别构建出多个相对应的结构关系图和属性二分
         图,并采用随机游走算法生成 Web 服务的结构上下文和属性上下文;然后,利用 SkipGram 模型对联合上下文进行训
         练,得到融合多维信息的表征向量;最后,采用 SVM 模型实现 Web 服务的分类预测.在 ProgrammableWeb 真实数据集
         上进行对比实验,实验结果表明:相比于 Doc2vec,LDA,Deepwalk,Node2vec 和 TriDNR 这 5 种方法,所提出的方法在
         Macro F1 值上有了 135.3%,60.3%,12.4%,10.5%和 4.3%的提升,切实提高了服务分类的精度.
         关键词: Web 服务分类;GAT2VEC 模型;随机游走;SVM 模型
         中图法分类号: TP311

         中文引用格式:  肖勇,刘建勋,胡蓉,曹步清,曹应成.基于 GAT2VEC 的 Web 服务分类方法.软件学报,2021,32(12):3751−3767.
         http://www.jos.org.cn/1000-9825/6102.htm
         英文引用格式: Xiao Y, Liu JX, Hu R, Cao BQ, Cao YC. GAT2VEC-based Web service classification method. Ruan Jian Xue
         Bao/Journal of Software, 2021,32(12):3751−3767 (in Chinese). http://www.jos.org.cn/1000-9825/6102.htm

         GAT2VEC-based Web Service Classification Method
                                                          1,2
                  1,2
                                            1,2
                                 1,2
         XIAO Yong ,   LIU Jian-Xun ,  HU Rong ,   CAO Bu-Qing ,   CAO Ying-Cheng 1,2
         1
          (Hunan Key  Laboratory  for  Services Computing and Novel  Software Technology  (Hunan University  of  Science and Technology),
          Xiangtan 411201, China)
         2
          (School of Computer Science and Engineering, Hunan University of Science and Technology, Xiangtan 411201, China)
         Abstract:    With the development of SOA technology, Web service is widely used and the number of services is growing rapidly. It is
         very important to classify Web service correctly and efficiently to improve the quality of service discovery and promote the efficiency of
         service composition. However, the existing Web service classification technologies have some problems, such as sparse description text,
         insufficient consideration of attribute information, and structural relationship. Therefore, it is difficult to effectively improve the accuracy
         of Web service classification. In order to solve this problem, this study proposes a GAT2VEC-based Web service classification method.
         Firstly, according to the structural relationship between Web services and their own attribute information, several corresponding structural
         diagrams and attribute bipartite diagrams are constructed respectively, and the random walk algorithm is used to generate the structural
         context and attribute context of Web services. Then, the SkipGram model is used to train the joint context to obtain the word vector which
         merges the multidimensional information. Finally, the SVM model is used to perform the classification and prediction of Web services.

            ∗  基金项目:  国家自然科学基金(61872139, 61873316, 61702181);  湖南省自然科学基金(2018YFB1402800-04, 2018JJ2139, 2018
         J2136, 2018JJ3190)
              Foundation item: National Natural Science Foundation of China (61872139, 61873316, 61702181); Natural Science Foundation of
         Hunan Province (2018YFB1402800-04, 2018JJ2139, 2018JJ2136, 2018JJ3190)
              收稿时间: 2019-11-21;  修改时间: 2020-03-09;  采用时间: 2020-06-12
   82   83   84   85   86   87   88   89   90   91   92