Page 56 - 《软件学报》2025年第5期
P. 56
1956 软件学报 2025 年第 36 卷第 5 期
Mashup需求
mr=(d, L)
融合潜在联合词的
Mashup需求向量
Mashup需求的
潜在联合词
Nm(mr)
m m ... m Mashup服务
功能描述
Cw-1(mr) 基于SYAKE模型与标签
适配度的联合词提取方法
s s s s ... s s s
Cw(mr) Web API
功能描述
融合潜在联合词的
s s s s s s s Web API功能向量
s s s s ... s s s
Web API的
s s s s s s s 潜在联合词
Cw-2(mr)
图 6 融合潜在联合词的服务功能向量生成
定义 7. 语境权重. D 为一组服务描述集合, w 为服务描述 d 所包含的一个词, MeanSemSim(w, d) 是 w 与 d 中
词语的语义相似度的均值, TF-IDF(w, d, D) 是词 w 的 TF-IDF 词频, 词 w 的语境权重定义见公式 (1), 语境权重表
示了词语在服务描述中的重要度, 其值越大, 词语的重要度越高.
W Con = MeanSemSim(w,d)·(TF-IDF(w,d,D)) (1)
定义 8. 场景适配权重. Ld 为服务描述集合 D 中的服务所对应标签的集合. 对于 d ∈ D 中的词语 w, 其场景适
配权重如公式 (2) 所示:
∑ ∑
sim(h w ,h l ) sim(h w ,h l )
W scen = l∈d.L · −log l∈(Ld−d.L) (2)
|Ld| |Ld −d.L|
在本文中, sim(h i , h j ) = h i h j /||h i ||⋅||h j ||为余弦相似度函数. d.L 为服务描述 d 的标签集合, h w 与 h l 分别为 w 与 l 所
对应的词向量, 由 Word2Vec 训练得到. 标签表示了服务的应用场景, 如果词 w 与其所在服务描述对应标签的相似
度高, 且与其他服务的标签相似度低, 则其场景适配权重高, 说明该词与服务描述的应用场景契合度高 [28] .
受 Campos 等人 [27] 在 YAKE 中对各项词语权重组合方式的启发, 在 SYAKE 中, 基于以上 6 种特征权重获得
词语 w 在服务描述 d 中的综合权重如公式 (3) 所示. 权重值越低, 表示词 w 在服务描述 d 中重要度越高.
W pos ·W rel
SYAKE(w) = (3)
W con W dif
W case + + +W scen
W rel W rel
3.1.2 潜在联合词的推荐
为 Mashup 服务需求和候选组件 Web API 提取潜在联合词, 可以补充 Mashup 服务需求描述和 Web API 功能
描述的应用场景特征, 丰富二者匹配过程中的功能语义, 提高匹配精确度.
在进行潜在联合词提取时, 需要为 Mashup 服务需求 mr 确定候选组件 Web API 集合. 首先, 获取与 Mashup 服务
需求相似的 Mashup 服务集合 Nm(mr). 然后, 分别求得 Nm(mr) 的一阶和二阶组件 Web API 集合 Cw-1(mr) 和 Cw-2(mr).
将 Cw-1(mr) 和 Cw-2(mr) 合并为 Cw(mr), 作为 mr 的候选组件 Web API 集合. 为 Mashup 服务需求 mr 推荐的潜在
联合词将在 Cw(mr) 集合中的 Web API 的服务描述中提取. Cw(mr) 中的 Web API 所对应的潜在联合词则提取至