Page 101 - 《软件学报》2021年第12期
P. 101

肖勇  等:基于 GAT2VEC 的 Web 服务分类方法                                                    3765


                                         [1]
         Bi-LSTM 的 Web 服务分类方法.Ye 等人 利用 Wide & Bi-LSTM 模型对 Web 服务类别进行深度预测,挖掘 Web
                                                    [7]
         服务描述文档中词语的语序和上下文信息.Chen 等人 针对富含全局主题信息与局部语义信息的移动应用内
         容表征文本,引入注意力机制区分其不同单词的贡献度,提出一种主题注意力机制增强的移动应用分类方法.
             此外,基于 QoS 的 Web 服务分类主要考虑 Web 服务的质量,通常使用到的 QoS 包括吞吐量、可用性、执
         行时间等.Moraru 等人    [26] 提出一个将语义技术与逻辑推理相结合的混合系统(即 OpenCyc),其通过与数值微积
         分进行分类、评估,推荐 QoS 感知 Web 服务.Makhlughian 等人          [27] 提出了一个整体的服务选择和排序,该方法首
         先根据用户的 QoS 要求和偏好将候选 Web 服务分类到不同的 QoS 级别,然后通过语义匹配对最合适的候选服
         务进行匹配.TF 等人     [28] 提出了一种基于 QoS 参数和 KNN(K-nearest neighbors)算法的 Web 服务有效选择方法,
         并通过加入新的并行分类模型,提高了系统的性能.
             上述方法考虑到了 Web 服务描述文档中的长度、有限语料库和稀疏特征等问题,并在服务语料库的训练
         过程中引入了辅助信息(如词分类信息、标签信息等)                  [29] ,但是它们并没有考虑到 Web 服务之间丰富的链接结构
         关系.
             近年来,NRL 技术的不断成熟为解决此类问题提供了良好的思路,并使得机器学习任务(如分类、预测和推
         荐)在网络中的应用成为了可能.NRL 的一种常见方法是,使用节点的内容或属性信息来学习图的嵌入向量,例
         如深度神经网络模型 SkipGram       [30] 和 Le 提出的段落向量模型     [31] 等.
             当利用来自结构和属性两者的信息时,NRL 所学习的表示往往会更加精确.属性信息的引入,使得模型能够
         利用上下文信息来学习稀疏连接的、甚至断开的节点的嵌入;而结构信息的引入,使得模型能够在学习的嵌入
         中保持节点的结构相似性.在这两个信息源的相辅相成之下,节点的低维嵌入学习会更加精确.Yang 等人                                   [11] 表
         明了 Deepwalk 等价于分解邻接矩阵 M,并提出一种名为 TADW 的模型,该模型通过对文本相关的矩阵进行分
         解来融合节点的文本特征.尽管 TADW 已经取得的不错的效果,但存在几个局限性:(1)  它分解近似矩阵,因此表
         示较差;(2)  它高度依赖于计算昂贵的奇异值分解(SVD);(3)  它不适用于大型的网络表征.
             近几年来,人们提出了各种利用标签信息来学习嵌入的半监督学习方法                          [12,32] .标签是与顶点相关联的类,用
         于对学习嵌入的分类器进行训练,以标记非标记节点.结果表明:通过在学习过程中加入标签,嵌入效果将会更
         好.使用标签信息的原因是:具有相似标签的节点往往具有很强的互连性和属性的高度相似性,因此也应该具有
         相似的嵌入.Pan 等人     [12] 提出的 TriDNR 使用了 3 种信息来源:结构、文本和嵌入的部分标签.该模型使用两层神
         经网络:第 1 层基于 Deepwalk 学习基于结构的表示,第 2 层使用 Doc2vec           [17] 学习内容和部分标签的表示.最后的
         表示是两者的线性组合.
             然而,上述方法只适用于同构网络.最新的 NRL 方法学习了异构网络中节点的表示.Dong 等人                             [33] 提出了
         Metapath2vec,该模型利用基于元路径的随机游走来生成网络中不同类型节点之间的语义关系.然而,这项工作
         忽略了相似节点之间的关系,如论文之间的引用等.预测文本嵌入(PTE)                      [14] 学习了一个包含文字、文档和标签的
         异构文本网络嵌入.随着网络表征学习的广泛应用,通过融合文本属性和结构网络信息来提升分类精度的思想
         得以实现.

         4    结   论

             本文提出一种基于 GAT2VEC 的 Web 服务分类方法 GWSC,它使用网络结构和顶点属性来学习服务网络
         图的表征向量,并采用一种新的方法来捕获属性内容.首先,它从网络中提取结构上下文,并从属性二分图中提
         取属性上下文;然后,使用一个浅层神经网络模型,从这两个上下文中联合学习一个表征向量,通过对与网络相
         关的多个信息源进行建模,并采用适当的学习方法,使学习得到的信息与原始输入图的信息尽可能保持一致;最
         后,采用 SVM 分类器进行分类.在真实世界数据集上的广泛实验表明:我们的方法能够准确地表征图中顶点的
         结构和属性上下文,进而提高了 Web 服务分类精度.对于未来的工作,我们将会考虑利用与不同类型顶点相关的
         不同信息扩展 GWSC 来学习异构网络中的顶点表示.
   96   97   98   99   100   101   102   103   104   105   106