Page 55 - 《软件学报》2025年第5期
P. 55
胡强 等: 融合潜在联合词与异质关联兼容的 Web API 推荐 1955
最后, 结合自注意力机制优化 mr 的需求向量和 Web API 的关联向量, 与 Web API 功能向量一起输入全连接
层, 输出每个候选 Web API 的概率值进行 Top-K 推荐.
构建Web API的异质 输入Mashup服务需求 求解mr的相似Mashup 生成mr的候选组件
关联图 mr=(d, L) 服务集合Nm(mr) Web API集合
一阶候选组件集合
面向关联强度的 Cw-1(mr)
随机游走策略
mr的潜在联合词 二阶候选组件集合 Web API的潜在
Law(mr) 联合词Law(s)
改进GATNE模型 Cw-2(mr)
Web API异质关联向量vc(s) 融合联合词的Mashup 融合联合词的Web
服务需求向量vf(mr) API 功能向量vf(s)
注意力机制
Mashup服务需求功能
注意力机制
Web API兼容向量vc(s) att
匹配向量vf(mr) att
Top-K Web APIs
图 5 研究框架
3 研究方法
本节从服务功能向量的生成、服务关联向量的生成以及组件 Web API 的推荐这 3 个层次, 介绍所构建融合
潜在联合词与异质关联兼容的 Mashup 服务组件 Web API 推荐方法.
3.1 融合潜在联合词的服务功能向量生成
高质量的服务功能向量能够提升 Web API 与 Mashup 服务需求之间的功能匹配精确度, 从而提高候选组件
Web API 集合的求解质量. 本文构建一种融入场景契合度的服务描述特征词提取模型 SYAKE, 用于提取服务描述
中的特征词, 并结合标签适配度, 为 Mashup 服务需求和候选 Web API 生成潜在联合词. 建立融合潜在联合词的
Mashup 服务需求向量和 Web API 功能向量, 以提升功能匹配的合理性, 具体流程见图 6.
3.1.1 融入场景契合度的服务描述特征词提取模型 SYAKE
YAKE 是一种无监督关键词抽取模型, 不依赖于外部训练语料, 在不同长度文本的关键词提取中均具有优异
性能 [27] . 为生成高质量的潜在联合词, 需要将能够表示服务应用场景的特征词优先提取出来. 然而, YAKE 模型从
文本统计的角度提取特征词, 难以保障提取的特征词与服务应用场景具有较高的语义关联度. 为此, 本文构建了一
种融入场景契合度的服务描述特征词提取模型 SYAKE.
SYAKE 保留原始 YAKE 模型的四种权重指标: 词形权重 W case (首字母大写的单词重要度高于小写的单词)、
位置权重 W pos (位置越靠前的词重要度越高)、词汇共现权重 W rel (两侧不同词的数量越多, 单词重要度越低) 和句
频权重 W dif (出现在句子数量越多的单词重要度越高). 在此基础上, 设计了语境权重和场景适配权重 (合称为场景
契合度), 提高筛选特征词与文本语境及应用场景的契合度.