Page 252 - 《软件学报》2020年第10期
P. 252

3228                                  Journal of Software  软件学报 Vol.31, No.10, October 2020

             首先,我们分析加权因子对模型 TfIDfDynamicVLWEA 的精度和特征库压缩比的影响.从图 3(b)中可以看
         出,随着θ的增大,压缩比显著减小,当θ大于 5 后,减速变缓.同时,从图 3(a)中可以看出,随着θ的增大,数据集精度
         呈现出不同的变化趋势.例如,数据集 Beef 和 Ham 上的模型精度随θ增大,先增大后减小;数据集 BeetleFly、
         ShapeletSim 等的精度随θ增大,变化不大;数据集 Herring 的精度随θ增大,呈现先减小后增大的趋势.由于当θ为 3
         时,模型的平均精度最大,压缩比较优,因此综合考虑,我们选择将模型的参数θ设为 3.
















                               (a)  实例数                                       (b)  时间序列长度
                               Fig.2  The running time of model TfIDfDynamicVLWEA
                                   图 2   模型 TfIDfDynamicVLWEA 运行时间分析

















                        (a) θ对精度的影响                                            (b) θ对压缩比的影响
                       Fig.3    Analysis of the influence of the parameter θ on model TfIDfDynamicVLWEA
                                图 3   模型 TfIDfDynamicVLWEA 参数θ的影响分析

             图 4 给出了 10 个数据集上模型 TfIDfDynamicVLWEA 精度及平均精度随最大滑动窗口长度和最大单词长
         度的变化趋势.
             从图 4(a)和图 4(b)可以看出,不同数据集对不同参数的敏感性不同.从图 4(a)中可以看出,Lightning7 数据集
         上的精度随最大滑动窗口长度的递增总体呈增长趋势 , 数据 集 ShapeletSim 、 BeetleFly 、 Symbols 、
         ToeSegmentation1 和 Ham 对最大窗口长度不敏感,数据集 Beef 和 Herring 对最大滑动窗口长度较为敏感,随窗
         口长度呈递增趋势,精度变化明显.上述实验结果表明,很难设定最优滑动窗口长度.由于最大滑动窗口长度取
         250 时,图 4(a)中平均精度值最大,同时也为了保证对比实验的公平性,我们将模型 TfIDfDynamicVLWEA 的最大
         窗口长度设为 250.
             从图 4(b)可以看出,数据集 Beef 和 Herring 对最大单词长度较为敏感,数据集 ShapeletSim、BeetleFly、Car、
         Symbols 和 ToeSegmentation1 对最大窗口长度不敏感,数据集 Ham、Lightning7 和 ToeSegmentation2 随最大单
         词长度发生变化,精度有波动.在区间[8,18]中 10 个数据集上的平均精度在 15 时最大,因此,我们将模型中 TfIDf
   247   248   249   250   251   252   253   254   255   256   257