Page 260 - 《软件学报》2021年第10期
P. 260

3232                                 Journal of Software  软件学报 Vol.32, No.10, October 2021

                 F10~F12,均方根误差可以被进一步小幅降低.这说明其他会话特征虽然在单独使用时效果不够理想,但在整体
                 使用时仍然可以产生一定的帮助.
                 6.4   历史特征
                    会话特征体现了用户短期内的使用习惯和使用趋势,因此能够对续航时间预测带来帮助.由此可以想到,用
                 户的长期使用习惯也应当可以给预测带来帮助.因此,本文接下来分析使用历史特征进行续航时间预测的效果.
                    本文采取以下 3 组历史特征.
                    (1)  用户 ID(F19).用户 ID 表示了当前会话属于哪个用户.由于数据集中共有 51 名用户,因此,该部分特征
                        采用一个 51 维的独热向量进行表示;
                    (2)  会话历史(F20).这部分内容包含了用户在历史会话(当前会话之前的所有会话)当中的耗电速率统计
                        信息,共包含 4 类信息:所有历史会话的耗电速率、与当前会话开始于同一小时的历史会话的耗电速
                        率、与当前会话开始于一周中同一天的历史会话的耗电速率、与当前会话开始于一周中同一天且同
                        一小时的历史会话的耗电速率.每种信息同时考虑了平均值和中位数,所以 F20 共包含 42=8 个值;
                    (3)  屏幕状态历史(F21).F21 表示了用户在历史会话中的屏幕状态变化信息,包括屏幕点亮的时间占比和
                        屏幕点亮的次数.具体计算方法类似于 F20.
                    上述特征的效果见表 6.F19 和 F21 并不能有效提升预测效果.F20 能够对预测产生帮助,但是效果比 F10~
                 F12 要差.这说明历史特征作为长期使用习惯,能够产生一定的预测效果,但却没有短期使用习惯的效果明显.

                                           Table 6    Performance of user history features
                                                  表 6   实验结果:历史特征
                                                                   模型
                                  特征         评价指标                                  最佳结果
                                                        Linear  GBRT   RF    XGB
                                            均方根误差        144.8  144.9  156.3  145.2  144.8
                                 F0,F19    Kendall’s Tau   0.599 1  0.608 7  0.543 6  0.608 0  0.608 7
                                          Concordance Index  0.874 7  0.876 9  0.846 8  0.876 6  0.876 9
                                            均方根误差        141.2  138.2  145.5  138.6  138.2
                                 F0,F20    Kendall’s Tau   0.622 7  0.640 0  0.595 3  0.638 5  0.640 0
                                          Concordance Index  0.877 7  0.884 5  0.866 2  0.884 1  0.884 5
                                            均方根误差        146.1  142.4  149.6  141.4  141.4
                                 F0,F21    Kendall’s Tau   0.599 5  0.609 2  0.563 3  0.611 2  0.611 2
                                          Concordance Index  0.874 2  0.877 8  0.857 1  0.878 7  0.878 7
                                            均方根误差        137.6  134.0  135.1  134.3  134.0
                               F0,F19~F21   Kendall’s Tau   0.636 3  0.655 0  0.627 2  0.655 0  0.655 0
                                          Concordance Index  0.886 1  0.891 1  0.877 8  0.891 1  0.891 1

                 6.5   综合使用所有特征
                    最终,本文分析同时采用全部特征的预测效果.结果见表 7.
                                          Table 7    Performance if we put features together
                                              表 7   实验结果:综合使用所有特征
                                                                  模型
                                  特征       评价指标                                   最佳结果
                                                       Linear  GBRT   RF    XGB
                                          均方根误差        141.2  132.7  138.2  131.4  131.4
                                 F0~F4    Kendall’s Tau   0.602 0  0.644 9  0.618 0  0.647 3  0.647 3
                                        Concordance Index  0.873 8  0.891 9  0.878 2  0.892 1  0.892 1
                                          均方根误差        128.9  115.0  118.5  114.1  114.1
                                 F0~F18   Kendall’s Tau   0.666 5  0.740 9  0.739 5  0.743 0  0.743 0
                                        Concordance Index  0.895 4  0.922 9  0.920 9  0.923 5  0.923 5
                                          均方根误差        124.7  110.6  120.3  110.4  110.4
                                 F0~F21   Kendall’s Tau   0.674 5  0.748 6  0.745 0  0.747 8  0.748 6
                                        Concordance Index  0.900 0  0.925 1  0.922 7  0.925 4  0.925 4
                    整体结论与前文结果类似:查询时特征能够带来的帮助不大;当引入会话特征时,预测效果的提升比较明
   255   256   257   258   259   260   261   262   263   264   265