Page 261 - 《软件学报》2021年第10期
P. 261
李豁然 等:基于细粒度数据的智能手机续航时间预测模型 3233
显;历史特征则可以进一步带来小幅提升.最终,模型将均方根误差从 149.9 降低至 110.4,将 Kendall’s Tau 从
0.585 6 提升至 0.748 6,将 Concordance Index 从 0.866 6 提升至 0.925 4.
6.6 讨 论
为验证本文的实验结果在统计意义上的显著性,首先采用 Bootstrap test and the shifted method 方法 [27] 对实
验结果进行了显著性检验,检验结果见表 8(*对应于 p-value≤0.1,**对应于 p-value≤0.5,***对应于 p-value≤
0.01).从表中可以看出:查询时特征对均方根误差的提升显著性不足,但在另外两种评价指标下的提升是统计显
著的.这说明均方根误差的确存在其局限性,因此排序型评价指标的引入是有价值的.会话特征和历史特征在所
有评价指标下的提升都是显著的.
Table 8 Statistic tests of experiment results
表 8 实验结果显著性检验
特征 最佳均方根误差 最佳 Kendall’s Tau 最佳 Concordance Index
F0~F4 131.4 0.6473*** 0.8921***
F0,F5~F18 114.8** 0.7407*** 0.9224***
F0,F19~F21 134.0 0.6550*** 0.8911***
F9~F21 110.4** 0.7486*** 0.9254***
除了统计显著性之外,本文同时关心模型带来的效果提升是否具有足够的实际价值.在这里,本文从最易于
直观理解的均方根误差入手,即希望回答如下问题:均方根误差从 150 分钟降低至 110 分钟是否具有实际价值?
从数值上看,降低 40 分钟均方根误差是非常显著的提升.用户可以利用该 40 分钟时间更加合理地安排使用.但
是降低后误差仍有 110 分钟,即接近两小时的时间,误差仍然较大.经过分析,本文认为,这是由于本文随机生成的
查询行为与用户的真实查询行为之间存在偏差所致.本文随机生成查询时,会随机选取查询时间和目标电量.如
果查询时电量和目标电量之间的差距较大,则实际的续航时间会更长,因此预测误差相对较大是正常的.但在实
际场景下,用户会倾向于在电量接近用尽时预测续航时间,查询时电量与目标电量的差距也会相对较小.在这样
的场景下,预测误差应当会相应降低.为了验证这一点,本文通过图 3(a)展示查询时电量与目标电量的差
(b(t q )b n )与均方根误差的关联,并通过图 3(b)展示目标电量(b n )与均方根误差的关联.从图中可以看出:当查询
时,若电量与目标电量较为接近,则预测误差实际上是比较小的.因此在实际场景下,用户更易于得到一个远低
于 110 分钟的预测误差.当目标电量为 20%时(手机的大致电量报警阈值),均方根误差仅为 30 分钟.这说明本文
提出的模型具有较好的实际应用价值.
(a) b(t q)b n (b) b n
Fig.3 Correlation between RMSE with b(t q )b n and b n , respectively
图 3 均方根误差与 b(t q )b n 和 b n 的关联
7 总 结
本文基于现有机器学习模型和一个长时间、细粒度的真实用户数据集,提出了一种智能手机电池续航时间