Page 172 - 《软件学报》2021年第9期
P. 172

2796                                 Journal of Software  软件学报 Vol.32, No.9,  September 2021

















                Fig.8    Movie Review(MR) dataset visualization (left) and accuracy of different text lengths (right)
                          图 8   电影评论数据集(MR)可视化(左)和不同文本长度下的精度(右)
         4    案例分析与自注意力可视化

         4.1   案例分析
             为了进一步分析本文提出的模型相对于 BiLSTM(无自注意力,无多通道特征),MF-BiLSTM(无自注意力机
         制,有多通道特征),WFCNN(使用了情感序列特征的 CNN)以及 LR-Bi-LSTM(使用了语言特征的 LSTM)等模型
         的优势,本文使用经过训练的 MFSA-BiLSTM,BiLSTM,MF-BiLSTM,WFCNN 和 LR-Bi-LSTM 预测几个具体的
         样例来进行分析.由于 MFSA-BiLSTM-D 是在 MFSA-BiLSTM 上提出的,因此,在本节,本文只对 MFSA-BiLSTM
         进行分析.
             如表 10 样例分类结果所示.
                                    Table 10    Analysis of typical sample cases
                                            表 10   典型样例分析
                  ID                    样例                      目标       模型       判断结果
                                                                      MFSA-BiLSTM    √
                      The last case (a different brand) we ordered from Amazon was   LR-Bi-LSTM   ×
                  1   so terrible we threw away the entire case. However, the Boscoli  1   MF-BiLSTM   √
                         brand is good and we can enjoy a good dirty martini.   BiLSTM   ×
                                                                        WFCNN        ×
                                                                      MFSA-BiLSTM    √
                                                                       LR-Bi-LSTM    ×
                      All of the elements are in place for a great film noir, but director
                  2                                               0    MF-BiLSTM     ×
                       george hickenlooper's approach to the material is too upbeat.
                                                                        BiLSTM       ×
                                                                        WFCNN        ×
                                                                      MFSA-BiLSTM    √
                                                                       LR-Bi-LSTM    √
                         After discovering the use of Samsung mobile phones,
                  3                                               0    MF-BiLSTM     √
                      my Weibo is full of typos! Can't stand it! Be careful! Be careful!
                                                                        BiLSTM       ×
                                                                        WFCNN        ×
             对于样例 3,情感词不是单独起作用的,而是通过词序列结合句子的上下语义表达出整个句子的情感.由于
         WFCNN 提取的特征是局部相邻词之间的特征,因此出现误分类.BiLSTM 虽然具有强大的上下文语义捕捉能
         力,但是样例 3 具有大量的正负面情感词,由于对特殊的情感词并没有进行处理,从而出现了误分类.而 MFSA-
         BiLSTM,LR-Bi-LSTM 和 MF-BiLSTM 这 3 个模型充分利用了语言知识,不仅有强大的上下文语义捕捉能力,并
         能根据上下语义对文本中的情感词进行程度加强,因此能够正确分类.对于样例 1 和样例 2,这种带有“however”
         “but”转折词的文本,LR-Bi-LSTM 并没有分类成功.原因是 LR-Bi-LSTM 模型的调节器具有局限性,它没有考虑
         句子的依赖关系,而直接对整个文本的情感词进行强度调节.MF-BiLSTM,能够根据句子结构、词的位置和词性
         特征对一些带有转折词的文本进行正确的分类(样例 1),但当遇到分类情感特征不明显且带转折的文本时,会分
   167   168   169   170   171   172   173   174   175   176   177