Page 175 - 《软件学报》2025年第5期
P. 175

张文跃 等: 基于高斯混合多层自编码器的情感漂移检测模型                                                    2075



                                                  表 9 漂移节点的关键事件

                  漂移日期                           事件描述                                    关键词
                          Prime Minister Prayut Chan-o-cha visited the search site and told the families of
                 2018-06-29                                                     hope, missing, update, pm, drilling
                                           the boys not to give up hope
                           The rescuers made some progress, they reached alarge cavern serve as a key  missing, predictions, press, clairvoyant,
                 2018-07-01
                                              base for the divers                         con
                            Saman Kunan, a 37-year-old former Thai NavySEAL, died of asphyxiation
                 2018-07-06                                                       seal, navy, oxygen, dies, died
                                              during the rescue
                 2018-07-08             Four boys was reported to have exited   soccer, prayers, praying, news, hope
                 2018-07-10        The remaining four boys and their coach wererescued  people, amazing, involved, news, saman
                    模型检测出的漂移时段和新剧集的播出日期之间的同步性通过表                        10  表示, 其中还记录了每集的正面评价比
                 例以及漂移日期相对播出日期的远近关系. 通过结果表格可以发现一种模式, 即公众对电视剧的积极情感在新一
                 集播出后会显著下降. 根据表         10, 检测到的   4  个漂移点被证明是播出日期的第          2  天, 由于每一集都会在晚上       8  点
                 左右首播   10  点左右结束, 这个延迟是可以接受的. 此外, 新模型检测到了两个漂移点出现在播出当天而不在普遍
                 出现漂移的第     2  天, 这表明这两个日期群体情感的变化比其他漂移点更快速更显著, 其中一集是剧情转折点而另
                 外一集是整个剧的大结局. 总而言之, 检测到的漂移日期和播出日期之间的相关性表明, 新模型能够有效发现群体
                 情感的变化.


                      Game of Thrones (season 8): Critical reception by episode  表 10 检测到的观众情感漂移时段
                     1.0

                                                                     播出日期
                                                               剧集   2019-04-14  2019-04-15  正面比例  相对播出日
                                                                              漂移日期
                    Position reviews (%)  0.6                   2 3 4  2019-04-21  2019-04-22  0.87  次日
                     0.8
                                                                                                 次日
                                                                1
                                                                                         0.92
                                                                                                 当天
                                                                             2019-04-28
                                                                    2019-04-28
                                                                                         0.74
                     0.4
                                                                                                 次日
                                                                    2019-05-05
                                                                                         0.58
                                                                             2019-05-06
                     0.2
                                                                                                 当天
                                                                                         0.48
                                                                6 5  2019-05-12  2019-05-13  0.49  次日
                                                                             2019-05-19
                                                                    2019-05-19
                      0
                       1     2      3     4     5     6
                                    Episodes
                      图 8    烂番茄网站评论中正面评价的比率
                 5   结论与展望
                    作为一项具有挑战性的任务, 群体情感漂移检测需要情感建模和漂移处理. 为了应对这一交叉任务, 本文提出
                 了基于高斯混合的分层变分自编码器             (GHVAE) 模型, 该模型使用了      Ex_ADD  漂移测量算法. 在    GHVAE  部分, 通
                 过时段层学习输入情感的潜在分布, 并应用高斯混合来提取顺序到达的数据之间的元分布. 在使用                                GHVAE  学习
                 历史输入信息后, 使用       Ex_ADD  来测量过去和新情感之间的差异. 为了验证模型的有效性, 本文进行了大量的实
                 验. 使用人工和带标签的推特数据进行定量评估, 并使用两个案例研究进行定性评估. 所有实验结果表明,
                 GHVAE  的性能优于对照和消融模型.
                    在未来的工作中, 该模型可以进一步扩展. 尽管本文中的模型在工程上有一些优势, 但是因为它与情感表示之
                 间缺少非常强的联系, 所以我们仍然希望有新的方法在文本情感表示和漂移分析之间建立更紧密的联系. 这项工
                 作中处理的信息是情感表示, 今后可以用其他类型的信息来代替, 例如主题、上下文等.
                 References:
                  [1]  Li Q, Wang TJ, Li P, Liu L, Gong QX, Chen YZ. The effect of news and public mood on stock movements. Information Sciences, 2014,
                     278: 826–840. [doi: 10.1016/j.ins.2014.03.096]
                  [2]  Zhang WY, Li XL, Li Y, Wang SG, Li DY, Liao J, Zheng JX. Public sentiment drift analysis based on hierarchical variational auto-
   170   171   172   173   174   175   176   177   178   179   180