Page 260 - 《软件学报》2021年第10期
P. 260
3232 Journal of Software 软件学报 Vol.32, No.10, October 2021
F10~F12,均方根误差可以被进一步小幅降低.这说明其他会话特征虽然在单独使用时效果不够理想,但在整体
使用时仍然可以产生一定的帮助.
6.4 历史特征
会话特征体现了用户短期内的使用习惯和使用趋势,因此能够对续航时间预测带来帮助.由此可以想到,用
户的长期使用习惯也应当可以给预测带来帮助.因此,本文接下来分析使用历史特征进行续航时间预测的效果.
本文采取以下 3 组历史特征.
(1) 用户 ID(F19).用户 ID 表示了当前会话属于哪个用户.由于数据集中共有 51 名用户,因此,该部分特征
采用一个 51 维的独热向量进行表示;
(2) 会话历史(F20).这部分内容包含了用户在历史会话(当前会话之前的所有会话)当中的耗电速率统计
信息,共包含 4 类信息:所有历史会话的耗电速率、与当前会话开始于同一小时的历史会话的耗电速
率、与当前会话开始于一周中同一天的历史会话的耗电速率、与当前会话开始于一周中同一天且同
一小时的历史会话的耗电速率.每种信息同时考虑了平均值和中位数,所以 F20 共包含 42=8 个值;
(3) 屏幕状态历史(F21).F21 表示了用户在历史会话中的屏幕状态变化信息,包括屏幕点亮的时间占比和
屏幕点亮的次数.具体计算方法类似于 F20.
上述特征的效果见表 6.F19 和 F21 并不能有效提升预测效果.F20 能够对预测产生帮助,但是效果比 F10~
F12 要差.这说明历史特征作为长期使用习惯,能够产生一定的预测效果,但却没有短期使用习惯的效果明显.
Table 6 Performance of user history features
表 6 实验结果:历史特征
模型
特征 评价指标 最佳结果
Linear GBRT RF XGB
均方根误差 144.8 144.9 156.3 145.2 144.8
F0,F19 Kendall’s Tau 0.599 1 0.608 7 0.543 6 0.608 0 0.608 7
Concordance Index 0.874 7 0.876 9 0.846 8 0.876 6 0.876 9
均方根误差 141.2 138.2 145.5 138.6 138.2
F0,F20 Kendall’s Tau 0.622 7 0.640 0 0.595 3 0.638 5 0.640 0
Concordance Index 0.877 7 0.884 5 0.866 2 0.884 1 0.884 5
均方根误差 146.1 142.4 149.6 141.4 141.4
F0,F21 Kendall’s Tau 0.599 5 0.609 2 0.563 3 0.611 2 0.611 2
Concordance Index 0.874 2 0.877 8 0.857 1 0.878 7 0.878 7
均方根误差 137.6 134.0 135.1 134.3 134.0
F0,F19~F21 Kendall’s Tau 0.636 3 0.655 0 0.627 2 0.655 0 0.655 0
Concordance Index 0.886 1 0.891 1 0.877 8 0.891 1 0.891 1
6.5 综合使用所有特征
最终,本文分析同时采用全部特征的预测效果.结果见表 7.
Table 7 Performance if we put features together
表 7 实验结果:综合使用所有特征
模型
特征 评价指标 最佳结果
Linear GBRT RF XGB
均方根误差 141.2 132.7 138.2 131.4 131.4
F0~F4 Kendall’s Tau 0.602 0 0.644 9 0.618 0 0.647 3 0.647 3
Concordance Index 0.873 8 0.891 9 0.878 2 0.892 1 0.892 1
均方根误差 128.9 115.0 118.5 114.1 114.1
F0~F18 Kendall’s Tau 0.666 5 0.740 9 0.739 5 0.743 0 0.743 0
Concordance Index 0.895 4 0.922 9 0.920 9 0.923 5 0.923 5
均方根误差 124.7 110.6 120.3 110.4 110.4
F0~F21 Kendall’s Tau 0.674 5 0.748 6 0.745 0 0.747 8 0.748 6
Concordance Index 0.900 0 0.925 1 0.922 7 0.925 4 0.925 4
整体结论与前文结果类似:查询时特征能够带来的帮助不大;当引入会话特征时,预测效果的提升比较明