Page 261 - 《软件学报》2021年第10期
P. 261

李豁然  等:基于细粒度数据的智能手机续航时间预测模型                                                     3233


                 显;历史特征则可以进一步带来小幅提升.最终,模型将均方根误差从 149.9 降低至 110.4,将 Kendall’s Tau 从
                 0.585 6 提升至 0.748 6,将 Concordance Index 从 0.866 6 提升至 0.925 4.
                 6.6   讨   论
                    为验证本文的实验结果在统计意义上的显著性,首先采用 Bootstrap test and the shifted method 方法            [27] 对实
                 验结果进行了显著性检验,检验结果见表 8(*对应于 p-value≤0.1,**对应于 p-value≤0.5,***对应于 p-value≤
                 0.01).从表中可以看出:查询时特征对均方根误差的提升显著性不足,但在另外两种评价指标下的提升是统计显
                 著的.这说明均方根误差的确存在其局限性,因此排序型评价指标的引入是有价值的.会话特征和历史特征在所
                 有评价指标下的提升都是显著的.
                                           Table 8    Statistic tests of experiment results
                                                 表 8   实验结果显著性检验
                                    特征      最佳均方根误差      最佳 Kendall’s Tau  最佳 Concordance Index
                                    F0~F4       131.4       0.6473***       0.8921***
                                  F0,F5~F18    114.8**      0.7407***       0.9224***
                                  F0,F19~F21    134.0       0.6550***       0.8911***
                                   F9~F21      110.4**      0.7486***       0.9254***
                    除了统计显著性之外,本文同时关心模型带来的效果提升是否具有足够的实际价值.在这里,本文从最易于
                 直观理解的均方根误差入手,即希望回答如下问题:均方根误差从 150 分钟降低至 110 分钟是否具有实际价值?
                 从数值上看,降低 40 分钟均方根误差是非常显著的提升.用户可以利用该 40 分钟时间更加合理地安排使用.但
                 是降低后误差仍有 110 分钟,即接近两小时的时间,误差仍然较大.经过分析,本文认为,这是由于本文随机生成的
                 查询行为与用户的真实查询行为之间存在偏差所致.本文随机生成查询时,会随机选取查询时间和目标电量.如
                 果查询时电量和目标电量之间的差距较大,则实际的续航时间会更长,因此预测误差相对较大是正常的.但在实
                 际场景下,用户会倾向于在电量接近用尽时预测续航时间,查询时电量与目标电量的差距也会相对较小.在这样
                 的场景下,预测误差应当会相应降低.为了验证这一点,本文通过图 3(a)展示查询时电量与目标电量的差
                 (b(t q )b n )与均方根误差的关联,并通过图 3(b)展示目标电量(b n )与均方根误差的关联.从图中可以看出:当查询
                 时,若电量与目标电量较为接近,则预测误差实际上是比较小的.因此在实际场景下,用户更易于得到一个远低
                 于 110 分钟的预测误差.当目标电量为 20%时(手机的大致电量报警阈值),均方根误差仅为 30 分钟.这说明本文
                 提出的模型具有较好的实际应用价值.














                                       (a) b(t q)b n                                           (b) b n
                                  Fig.3    Correlation between RMSE with b(t q )b n  and b n , respectively
                                            图 3   均方根误差与 b(t q )b n 和 b n 的关联

                 7    总   结

                    本文基于现有机器学习模型和一个长时间、细粒度的真实用户数据集,提出了一种智能手机电池续航时间
   256   257   258   259   260   261   262   263   264   265   266