Page 89 - 《软件学报》2021年第12期
P. 89
肖勇 等:基于 GAT2VEC 的 Web 服务分类方法 3753
的 TADW(text-associated deep walk)模型.Pan 等人 [12] 提出的 TriDNR(tri-party deep network representation)同时
使用结构、文本和嵌入的部分标签信息来进行网络表征.这些 NRL 方法的出现,使得我们充分考虑 Web 服务之
间的结构交互关系,并同时融合结构关系和文本属性的想法成为可能.在此基础上,为了解决传统 Web 服务分类
模型所存在的问题,本文提出一种基于 GAT2VEC [13] 的 Web 服务分类方法(简称 GWSC).通过从服务网络图中获
取包含组合调用等信息的结构上下文和服务自身的属性上下文,GWSC 充分保持了 Web 服务之间结构和属性
的邻近度,并使用了单一神经层共同学习这些特征,从而通过融合多个信息源提升了 Web 服务分类的精度.值得
一提的是:由于 GWSC 将属性文本信息以拓扑结构化的形式来表示,使得在低维空间中学习到的属性文本信息
表征也可以重构出原有的服务关系网络,从而可较好地解决文档语义稀疏的问题.
本文第 1 节具体介绍 GWSC 方法.第 2 节进行实验评估及分析.第 3 节介绍相关工作.第 4 节对本文工作进
行总结.
1 方法介绍
GWSC 方法框架如图 1 所示.首先,对于每个服务网络图中的顶点,我们通过随机游走得到其相对于其他顶
点的结构和属性上下文;然后,将这两种上下文语义信息结合起来,学习出一种既保留结构又保留属性近似值的
网络嵌入表征;最后,将得到的表征向量输入到 SVM 模型当中进行分类预测.其方法框架如图 1 所示,具体来
说,GWSC 由以下网络生成、随机游走、表征学习和 SVM 分类这 4 个阶段组成.
Fig.1 GWSC method framework
图 1 GWSC 方法框架
1.1 网络生成
首先,我们考虑一个如图 2 所示的服务网络图 G=(V,E,A),它由一组顶点 V、一组边 E 和一个属性函数
^
AV → 2 组成,其中,^是所有可能属性的集合.
:
Fig.2 Service network graph
图 2 服务网络图
例如:对于本文的 Web 服务网络,节点可以是 Mashup,如果两个 Mashup 调用了同一个 API,则认为这两个