Page 173 - 《软件学报》2025年第5期
P. 173
张文跃 等: 基于高斯混合多层自编码器的情感漂移检测模型 2073
验结果进行介绍并分析. 实验结果证明新模型结合新情感漂移度量算法可以得到更好的情感漂移检测表现.
4.1 人工数据实验表现
基于人工数据的实验有助于揭示理想场景下的模型性能, 理想场景具有有限的噪声, 涵盖了各种漂移模式和
数据分布. 具体而言, GAUSS 数据集具有有限的噪声, 存在突然式漂移, 并从高斯分布中采样, 而 CIRCLES 是无噪
声的逐渐漂移, 并从均匀分布中采样. 因此, 涵盖足够消融情况的两个人工数据集的性能表明了 GHVAE 的有效
性. 实验结果在表 5 和表 6 中介绍.
表 5 各模型在 GAUSS 数据集上的 AUC 表现 表 6 各模型在 CIRCLES 数据集上的 AUC 表现
漂移度量 漂移度量
模型 模型
ADD ADD2 Ex_ADD ADD ADD2 Ex_ADD
GHVAE 0.992 0.989 0.994 GHVAE 0.639 0.658 0.662
HVAE 0.989 0.993 0.992 HVAE 0.615 0.656 0.660
Plain 0.992 0.990 0.990 Plain 0.591 0.652 0.657
Ablations No_D 0.748 0.754 0.797 Ablations No_D 0.513 0.503 0.504
No_E 0.984 0.981 0.988 No_E 0.608 0.651 0.656
正如结果所示, 所有模型使用 GAUSS 数据相比使用 CIRCLES 数据表现明显更好, 因为编码过程和人工数据
的采样是互逆的操作, 同时也意味着如果 GAUSS 上的实验结果突出, 表明模型有能力更准确地从输入中提取信
息. 此外, GHVAE 不仅在 GAUSS 上的漂移检测表现突出, 在 CIRCLES 上也取得了最好结果 (如表 5 和表 6 中加
粗显示), 这证明新模型能够拟合输入并同时表现出良好的鲁棒性.
在所有模型中, No_E 表现最差, 说明编码过程在模型中发挥着更加关键的作用. 在 No_E 中用于比较的分布 (即
′ ′
z | z 和 z | S ) 彼此之间有很大不同. 显著的差异使得漂移测度过大且不稳定, 从而导致模型有效性降低. 相反, Plain
方法将一个窗口中的所有数据混合在一起, 并计算总体分布的参数. 因此, Plain 的性能比 No_E 模型好得多, 因为生
成的窗口分布与其中的时间段分布相对接近 (相比 No_E). 在所有度量之间的比较中, 本文提出的 Ex_ADD 取得了更
高的准确度, 说明指数放大机制是有效的. 根据结果, GHVAE+Ex_ADD 在 CIRCLES 和 GAUSS 数据集上都实现了
相对更好的表现. 特别是在 CIRCLES 的实验中, 新模型取得了更高的 AUC 证明了 GHVAE 的有效性.
前面提到的其他 3 个对照模型没有被应用于 AUC 测试, 因为这些模型与评估指标 AUC 不兼容. 为了将这些
模型加入对比, 对 CIRCLES 数据额外进行分类实验, 因为 CIRCLES 是带标记的语料库. 表 7 展示了所有模型的
分类性能, 其中 GHVAE+Ex_ADD 的分类准确度最高. 模型 IAMNB [42] 不支持数值型数据所以不参与对照实验.
VIGO [33] 和 IEWMA [30] 模型的度量算法采用内建式度量算法, 不支持 ADD 类方法, 所以表 7 中记录的是这两种模
型原始方法的实验结果. GHVAE 的准确度高于 HVAE 模型, 表明 Ex_ADD 有助于提高漂移检测准度. 此外,
GHVAE 和消融模型之间的对比结果体现了结构完整性的重要性, 即编码器和解码器的合作是 GHVAE 的关键.
表 7 各模型在 CIRCLES 数据上准确度性能
漂移度量
模型
ADD ADD2 Ex_ADD
GHVAE 0.317 0.358 0.367
HVAE 0.315 0.350 0.357
VIGO [33] 0.245
IEWMA [30] 0.251
Plain 0.265 0.310 0.323
Ablations No_D 0.262 0.270 0.285
No_E 0.207 0.235 0.251
4.2 S140 数据实验表现
与人工数据不同, S140 语料库中的文档是来自真实用户发布的推文. 此外, 语料库中每个文档都有情感极性