Page 69 - 《软件学报》2025年第5期
P. 69
胡强 等: 融合潜在联合词与异质关联兼容的 Web API 推荐 1969
50.42%. 冷启动 Web API 质量指标评价值接近于非冷启动 Web API 的一半. 同样, 在 Top-5 和 Top-7 的推荐过程
中, 冷启动 Web API 推荐的 Recall 分别为非冷启动 Web API 的 47.39% 与 46.53%, Precision 分别为非冷启动
Web API 的 46.7% 与 42.62%, 与 Top-3 基本保持一致. 因此, 本文方法较好地解决了冷启动 Web API 的推荐问题.
表 6 DS1–DS4 推荐质量指标
数据 Top-K Recall Precision NDCG ILS HR
K=3 0.481 0.426 0.467 0.465 0.151
DS1 K=5 0.597 0.337 0.524 0.427 0.192
K=7 0.692 0.295 0.580 0.404 0.218
K=3 0.468 0.431 0.462 0.453 0.154
DS2 K=5 0.602 0.341 0.537 0.412 0.191
K=7 0.689 0.294 0.582 0.388 0.219
K=3 0.449 0.428 0.432 0.464 0.153
DS3 K=5 0.596 0.335 0.524 0.431 0.191
K=7 0.696 0.288 0.583 0.410 0.218
K=3 0.473 0.433 0.472 0.454 0.159
DS4 K=5 0.606 0.345 0.527 0.438 0.198
K=7 0.694 0.301 0.580 0.384 0.225
4.3.5 关键实验参数设置
本节对 Web API 推荐过程中的关键参数进行优化设置.
(1) 为 Mashup 服务需求获取 X 个相似 Mashup 服务以及 Y 个二阶潜在候选组件 Web API 时, X 值与 Y 值分
别取多少推荐质量最高?
X 和 Y 的值决定了候选组件集合中 Web API 的数量和质量, 对 Web API 推荐精确度有较大影响. 考虑到数据
集中 Mashup 服务包含的 Web API 的数量平均为 2.8 个, 参考与本文方法类似的文献所设置邻居 Mashup 服务的
数量, 将 X (Nm(mr) 中服务的数量) 取值设置为 [1, 10]. 为了提高推荐精确度, 候选组件 Web API 集合中的服务数
量不宜设置过大, 在此将 Y 的取值范围也设置为 [1, 10]. 在 3 种 K 值下开展实验. Recall、Precision 与 NDCG 指标
三维曲面趋势参见图 8.
在 X 值不变的情况下, 随 Y 值上升, 或在 Y 值不变的情况下, 随 X 值上升, 推荐质量均呈先上升, 后下降的趋
势. 在不同的 Top-K 推荐场景下, Precision 由推荐出来正确组件 Web API 个数与 K 值的比值确定, 而 Recall 则是
由推荐正确的组件 Web API 个数与总服务个数的比值确定, NDCG 侧重正确推荐的 Web API 在推荐列表中的排
序. 在同一组 (K, X, Y) 取值下, 正确推荐的组件 Web API 数量是确定的, 因此, Precision、Recall 和 NDCG 在同一
个 K 取值的推荐场景下, 三者的取值增减随 (X, Y) 变化同步, 曲面图在同一个 (X, Y) 坐标点到达拐点. 经过统计,
K=3、5、7 时, Web API 推荐效果分别在 (4, 5)、(6, 3)、(5, 4) 处取得最佳质量
从图 8 中的曲面变化趋势可以看出, X 值的变化相对于 Y 值的变化会对推荐效果的影响更大, 说明 Nm(mr) 中
服务数量对推荐质量会产生较大影响. 其原因是 Nm(mr) 是与 Mashup 服务需求相似的 Mashup 服务集合, X 值决
定了 Nm(mr) 中服务的数量, 从而影响了 Nm(mr) 中服务与 Mashup 服务需求的相似度, 从协同过滤角度, 选择与推
荐目标相似度越高的参照对象, 推荐效果越好, 因此 X 值的变化对于推荐效果会更敏感.
此外, X 和 Y 值决定了最终候选组件 Web API 的数量和质量. 当 X 值或 Y 值过低, 则 Mashup 服务需求的邻居
服务与候选组件 Web API 数量较少, 导致无法将真实组件 Web API 加入候选集合, 也不利于潜在联合词的提取,
从而影响推荐质量. 当 X 值或 Y 值过高, 会将与 Mashup 服务需求契合度低的 Web API 加入到候选组件 Web API
集合, 同样影响潜在联合词提取和异质关联兼容的计算质量, 从而降低推荐质量.
(2) 单个标签对应潜在联合词融入数量为多少时推荐质量最高?
潜在联合词为 Mashup 服务和 Web API 的功能向量补充了应用场景特征. 为验证潜在联合词数量对推荐质量
影响, 将标签对应特征词的提取数量 n 设置为区间 [0, 10], 在 3 种 K 值下开展实验, Recall、Precision 和 NDCG 的
指标折线趋势参见图 9–图 11, 图中横坐标为 n 的值, 纵坐标为评价指标值.