Page 252 - 《软件学报》2020年第10期
P. 252
3228 Journal of Software 软件学报 Vol.31, No.10, October 2020
首先,我们分析加权因子对模型 TfIDfDynamicVLWEA 的精度和特征库压缩比的影响.从图 3(b)中可以看
出,随着θ的增大,压缩比显著减小,当θ大于 5 后,减速变缓.同时,从图 3(a)中可以看出,随着θ的增大,数据集精度
呈现出不同的变化趋势.例如,数据集 Beef 和 Ham 上的模型精度随θ增大,先增大后减小;数据集 BeetleFly、
ShapeletSim 等的精度随θ增大,变化不大;数据集 Herring 的精度随θ增大,呈现先减小后增大的趋势.由于当θ为 3
时,模型的平均精度最大,压缩比较优,因此综合考虑,我们选择将模型的参数θ设为 3.
(a) 实例数 (b) 时间序列长度
Fig.2 The running time of model TfIDfDynamicVLWEA
图 2 模型 TfIDfDynamicVLWEA 运行时间分析
(a) θ对精度的影响 (b) θ对压缩比的影响
Fig.3 Analysis of the influence of the parameter θ on model TfIDfDynamicVLWEA
图 3 模型 TfIDfDynamicVLWEA 参数θ的影响分析
图 4 给出了 10 个数据集上模型 TfIDfDynamicVLWEA 精度及平均精度随最大滑动窗口长度和最大单词长
度的变化趋势.
从图 4(a)和图 4(b)可以看出,不同数据集对不同参数的敏感性不同.从图 4(a)中可以看出,Lightning7 数据集
上的精度随最大滑动窗口长度的递增总体呈增长趋势 , 数据 集 ShapeletSim 、 BeetleFly 、 Symbols 、
ToeSegmentation1 和 Ham 对最大窗口长度不敏感,数据集 Beef 和 Herring 对最大滑动窗口长度较为敏感,随窗
口长度呈递增趋势,精度变化明显.上述实验结果表明,很难设定最优滑动窗口长度.由于最大滑动窗口长度取
250 时,图 4(a)中平均精度值最大,同时也为了保证对比实验的公平性,我们将模型 TfIDfDynamicVLWEA 的最大
窗口长度设为 250.
从图 4(b)可以看出,数据集 Beef 和 Herring 对最大单词长度较为敏感,数据集 ShapeletSim、BeetleFly、Car、
Symbols 和 ToeSegmentation1 对最大窗口长度不敏感,数据集 Ham、Lightning7 和 ToeSegmentation2 随最大单
词长度发生变化,精度有波动.在区间[8,18]中 10 个数据集上的平均精度在 15 时最大,因此,我们将模型中 TfIDf