Page 258 - 《软件学报》2021年第10期
P. 258
3230 Journal of Software 软件学报 Vol.32, No.10, October 2021
6.2 查询时特征的效果
接上一小节的思路,本小节首先研究利用查询时特征预测续航时间的效果.相关特征共包含 4 组:F1~F4.本
文首先单独基于每组特征训练预测模型,以观察每组模型单独使用时的效果.结果显示,单独利用 F1~F4 预测续
航时间的效果要远差于利用 F0 进行预测.这验证了 F0 的确是最重要的预测指标,其他指标仅能起到辅助作用.
因此,本文分别将 F1~F4 与 F0 进行组合,来预测续航时间(即利用 F0+F1 预测,F0+F2 预测,以此类推),然后
将 F0~F4 进行整体组合预测续航时间.结果见表 4.在这 4 组特征当中,效果最好的是 F1,能够将 Kendall’s Tau
从 0.585 6 提高至 0.623 0,将均方根误差从 149.9 降低至 140.1.当同时采用 4 组特征时,均方根误差可以被降低
18.5 分钟,而 Kendall’s Tau 和 Concordance Index 分别可以提升 0.062 和 0.025.
Table 4 Performance of query-time features
表 4 实验结果:查询时特征
模型
特征 评价指标 最佳结果
Linear GBRT RF XGB
均方根误差 149.9 150.6 150.9 151.0 149.9
F0 Kendall’s Tau 0.584 3 0.585 6 0.582 1 0.585 5 0.585 6
Concordance Index 0.866 6 0.865 9 0.865 2 0.866 0 0.866 6
均方根误差 144.8 140.1 151.4 140.7 140.1
F0,F1 Kendall’s Tau 0.591 8 0.623 0 0.568 4 0.622 8 0.623 0
Concordance Index 0.870 1 0.883 8 0.862 2 0.883 8 0.883 8
均方根误差 146.5 146.7 155.9 147.0 146.5
F0,F2 Kendall’s Tau 0.595 4 0.601 3 0.565 3 0.601 7 0.601 7
Concordance Index 0.873 2 0.874 2 0.855 9 0.874 5 0.874 5
均方根误差 148.8 148.4 150.6 148.8 148.4
F0,F3 Kendall’s Tau 0.568 3 0.573 3 0.561 8 0.573 3 0.573 3
Concordance Index 0.864 6 0.865 5 0.859 2 0.865 6 0.865 6
均方根误差 148.5 144.1 150.6 143.7 143.7
F0,F4 Kendall’s Tau 0.579 3 0.601 5 0.544 0 0.603 7 0.603 7
Concordance Index 0.867 0 0.874 7 0.849 1 0.875 5 0.875 5
均方根误差 141.2 132.7 138.2 131.4 131.4
F0~F4 Kendall’s Tau 0.602 0 0.644 9 0.618 0 0.647 3 0.647 3
Concordance Index 0.873 8 0.891 9 0.878 2 0.892 1 0.892 1
6.3 会话特征的效果
查询时特征的效果虽然已经好于基准线,但是仍然不能令人满意.查询时特征仅包含用户发起查询时的信
息,覆盖到的时间较短,信息量较少.如前文所述,用户在当前会话内发起查询前的使用行为与续航时间存在关
联.因此,本小节进一步分析会话特征对续航时间预测的效果.
会话特征共包含 14 组,见表 3 中的 F5~F18.具体来说,其中包含了会话开始时的相关信息(F5~F7)、使用时
间与电量消耗信息(F8~F12)、应用使用信息和传感器读数信息(F13~F16)以及系统事件信息(F17~F18).与上一
小节类似,这里首先使用每组特征单独与 F0 进行结合,观察其是否能够提高预测效果.相关结果见表 4.
相比于查询时特征,会话特征对预测效果的提升更为明显.当采用 F10 或 F11 时,使用 GBRT 和 XGB 的提
升效果非常显著.F10 是在当前会话内、查询前的平均耗电速率,F11 则是基于 F10 进行的朴素预测,即假设查
询后电池的耗电速率仍然保持 F10,基于此假设预测的续航时间.换言之,F11=F1/F10.
尽管上述两个特征比较简单,但其能够产生的效果是比较明显的.最好的均方根误差被降低了 20.8 分钟,最
好的 Kendall’s Tau 能够提升 0.12.
如果进一步精细化与耗电速率相关的特征,则可以得到更好的预测效果.从表 4 可以看出,效果最佳的会话
特征是 F12.F12 共包含 10 个值,分别表示从 b(t q )+1%,b(t q )+2%,…,b(t q )+10%消耗至 b(t q )的平均耗电速率.举例
来说,假设发起查询时的电量为 50%,那么 F12 包含的值为从 51%消耗至 50%、从 52%消耗至 50%、…、60%
消耗至 50%这 10 个时间段内的平均耗电速率.F12 可以表示出查询前设备的耗电趋势,例如:如果从 60%耗至
50%的平均耗电速率较低,但从 51%耗至 50%的平均耗电速率较高,则说明查询前的耗电速率呈现加速的趋势.