Page 173 - 《软件学报》2025年第5期
P. 173

张文跃 等: 基于高斯混合多层自编码器的情感漂移检测模型                                                    2073


                 验结果进行介绍并分析. 实验结果证明新模型结合新情感漂移度量算法可以得到更好的情感漂移检测表现.

                 4.1   人工数据实验表现
                    基于人工数据的实验有助于揭示理想场景下的模型性能, 理想场景具有有限的噪声, 涵盖了各种漂移模式和
                 数据分布. 具体而言, GAUSS     数据集具有有限的噪声, 存在突然式漂移, 并从高斯分布中采样, 而                   CIRCLES  是无噪
                 声的逐渐漂移, 并从均匀分布中采样. 因此, 涵盖足够消融情况的两个人工数据集的性能表明了                              GHVAE  的有效
                 性. 实验结果在表     5  和表  6  中介绍.

                    表 5 各模型在    GAUSS  数据集上的    AUC  表现         表 6 各模型在     CIRCLES  数据集上的   AUC  表现

                                           漂移度量                                         漂移度量
                        模型                                           模型
                                    ADD    ADD2    Ex_ADD                        ADD    ADD2    Ex_ADD
                       GHVAE        0.992  0.989    0.994           GHVAE        0.639   0.658   0.662
                       HVAE         0.989  0.993    0.992           HVAE         0.615   0.656   0.660
                             Plain  0.992  0.990    0.990                 Plain  0.591   0.652   0.657
                   Ablations  No_D  0.748  0.754    0.797       Ablations  No_D  0.513   0.503   0.504
                            No_E    0.984  0.981    0.988                 No_E   0.608   0.651   0.656

                    正如结果所示, 所有模型使用         GAUSS  数据相比使用     CIRCLES  数据表现明显更好, 因为编码过程和人工数据
                 的采样是互逆的操作, 同时也意味着如果             GAUSS  上的实验结果突出, 表明模型有能力更准确地从输入中提取信
                 息. 此外, GHVAE  不仅在   GAUSS  上的漂移检测表现突出, 在       CIRCLES  上也取得了最好结果       (如表  5  和表  6  中加
                 粗显示), 这证明新模型能够拟合输入并同时表现出良好的鲁棒性.
                    在所有模型中, No_E    表现最差, 说明编码过程在模型中发挥着更加关键的作用. 在                  No_E  中用于比较的分布     (即
                   ′   ′
                 z | z  和  z | S  ) 彼此之间有很大不同. 显著的差异使得漂移测度过大且不稳定, 从而导致模型有效性降低. 相反, Plain
                 方法将一个窗口中的所有数据混合在一起, 并计算总体分布的参数. 因此, Plain                   的性能比   No_E  模型好得多, 因为生
                 成的窗口分布与其中的时间段分布相对接近              (相比  No_E). 在所有度量之间的比较中, 本文提出的          Ex_ADD  取得了更
                 高的准确度, 说明指数放大机制是有效的. 根据结果, GHVAE+Ex_ADD               在  CIRCLES  和  GAUSS  数据集上都实现了
                 相对更好的表现. 特别是在       CIRCLES  的实验中, 新模型取得了更高的        AUC  证明了  GHVAE  的有效性.
                    前面提到的其他       3  个对照模型没有被应用于       AUC  测试, 因为这些模型与评估指标          AUC  不兼容. 为了将这些
                 模型加入对比, 对     CIRCLES  数据额外进行分类实验, 因为        CIRCLES 是带标记的语料库. 表       7  展示了所有模型的
                 分类性能, 其中    GHVAE+Ex_ADD   的分类准确度最高. 模型        IAMNB [42] 不支持数值型数据所以不参与对照实验.
                 VIGO [33] 和  IEWMA [30] 模型的度量算法采用内建式度量算法, 不支持        ADD  类方法, 所以表    7  中记录的是这两种模
                 型原始方法的实验结果. GHVAE          的准确度高于      HVAE  模型, 表明  Ex_ADD  有助于提高漂移检测准度. 此外,
                 GHVAE  和消融模型之间的对比结果体现了结构完整性的重要性, 即编码器和解码器的合作是                            GHVAE  的关键.

                                           表 7 各模型在     CIRCLES  数据上准确度性能

                                                                        漂移度量
                                      模型
                                                           ADD          ADD2         Ex_ADD
                                     GHVAE                 0.317        0.358         0.367
                                     HVAE                  0.315        0.350         0.357
                                     VIGO [33]                           0.245
                                    IEWMA [30]                           0.251
                                              Plain        0.265        0.310         0.323
                              Ablations      No_D          0.262        0.270         0.285
                                             No_E          0.207        0.235         0.251

                 4.2   S140  数据实验表现
                    与人工数据不同, S140     语料库中的文档是来自真实用户发布的推文. 此外, 语料库中每个文档都有情感极性
   168   169   170   171   172   173   174   175   176   177   178