Page 297 - 《软件学报》2021年第7期
P. 297
贾修一 等:基于变分自编码器的异构缺陷预测特征表示方法 2215
例如,PDEPC4 组合下,其 2 在小于 1 时能收敛到较好性能,但在 AR6PC4 组合下,其 2 在大于 1 时可以收敛
至较好性能,但也可以看出,较大范围的参数配置都可以得到较好的性能,进一步佐证了我们算法的鲁棒性.
对于不同的损失项,其参数调节的范围难以确定,许多情况下,过大的权重会导致模型的极度不稳定,例如,
在 PDEPC4 下,当后验分布与先验分布的 KL 散度以及分类损失交差熵的权重过大时,模型的性能不仅会很
差,而且随着训练进程的推进,其预测的波动变化也很大.部分情况下会导致最终的性能走到相反的极端,这
种情况可能是由于在对分布进行映射学习时,两者的条件概率分布映射到了相反的方向,由于目标项目的标
记信息是完全未知的,因此出现这种情况也是有一定可能性的,通过将参数调整到更小的范围内可以有效地
缓解该问题.
另外一个现象是,在许多场景中,初始训练时,在模型的参数处于完全随机的情况下,反而有可能得到较好
的性能,随着训练过程不断推进,性能会有或多或少的下降,然后才会回升并趋于稳定.通过观察多组实验结果,
这种情况是大量存在的,至于出现这种现象的原因,暂时尚未有合理的解释,还值得进一步研究与探索.
(a) PDEPC4 (b) AR6PC4
Fig.6 The performance variation of prior distribution difference under different weights
based on given MMD and misclassification loss weight
图 6 在给定最大均值差异和分类损失权重情况下,先验分布差异在不同权重下的性能变化
(a) PDEPC4 (b) AR6PC4
Fig.7 The performance variation of MMD under different weights based on
given prior distribution difference and misclassification loss weight
图 7 在给定先验分布差异和分类损失权重情况下,最大均值差异在不同权重下的性能变化