Page 193 - 《软件学报》2025年第4期
P. 193

陈强 等: 融合任务知识的多模态知识图谱补全                                                          1599



                                           表 4 任务知识融合模块对于实验结果的影响

                                            FB15k-237                               WN9
                   图像编码器             LSTM               GRU               LSTM               GRU
                                Hit@10    MRR      Hit@10    MRR      Hit@10    MRR     Hit@10    MRR
                    ResNet50     0.527    0.348     0.531    0.349    0.921    0.909     0.921    0.908
                    ResNet101    0.534    0.352     0.530    0.350    0.918    0.907     0.921    0.907
                    ResNet151    0.530    0.351     0.529    0.349    0.919    0.907     0.919    0.907
                     VGG16       0.524    0.348     0.532    0.353    0.918    0.905     0.922    0.905
                      ViT        0.534    0.351     0.531    0.351    0.917    0.906     0.918    0.908
                      Ours       0.539    0.357     0.538    0.356    0.926    0.913     0.926    0.914

                 4.2   多模态融合过滤模块的影响
                    为了验证多模态融合过滤模块的有效性, 我们移除了模态融合过滤模块, 直接将                          3  种模态的实体向量进行求
                 和后求均值的操作, 通过实验得到在不同聚合算子下的性能, 结果如图                      4  所示. 可以发现, 使用了多模态融合过滤
                 之后, 各个指标下的性能均有所提升. 我们认为这得益于本文提出的模态融合过滤模块可以充分过滤掉不同模态
                                                            0.356
                 中与任务无关的信息, 融合和保留对当前任务有效的信息.

                         Ours w/ GRU  Ours w/ LSTM  Ours w/o RNN      Ours w/ GRU  Ours w/ LSTM  Ours w/o RNN
                    0.6                                        0.930
                                                               0.925
                    0.5
                                                               0.920
                    0.4
                                                               0.915
                    0.3                                        0.910
                    0.2                                        0.905
                                                               0.900
                    0.1
                                                               0.895
                     0                                         0.890
                         Hit@1    Hit@3   Hit@10   MRR                Hit@1    Hit@3   Hit@10   MRR

                          0.265   0.389    0.538   0.356              0.908    0.915   0.926    0.914
                          0.266   0.389    0.539   0.357              0.906    0.915   0.926    0.913
                          0.255   0.376    0.520   0.343              0.904    0.914   0.923    0.911
                                 (a) FB15k-237 数据集                             (b) WN9 数据集
                                             图 4 多模态融合过滤模块对实验的影响

                 4.3   模态序列顺序的影响
                    根据模态两两交互的顺序对于模态融合效果可能存在影响. 我们采用基于序列结构的                             RNN  网络, 因而我们改
                 变多模态融合过滤模块中不同模态的输入顺序, 来进一步验证顺序对性能的影响. 结果如表                             5  所示, 从表  5  中可以
                 发现, 采用  S-I-T  顺序可以带来最佳性能, 但是实际不同顺序带来的差异较小, 所以我们没有进一步深入分析. 在
                 实际应用中, 通常选择其中一种就可以达到相对较好的性能.

                                              表 5 模态顺序对于实验结果的影响.

                                           FB15k-237                                WN9
                   模态顺序            LSTM                GRU                LSTM               GRU
                               Hit@10    MRR      Hit@10    MRR      Hit@10    MRR      Hit@10    MRR
                     S-I-T     0.539     0.357     0.538              0.926    0.913     0.926    0.914
                     S-T-I     0.537     0.355     0.530    0.352     0.920    0.909     0.921    0.909
                     T-S-I     0.535     0.356     0.536    0.356     0.923    0.913     0.922    0.911
                 注: S表示实体的结构向量表示, I表示图像向量表示, T表示文本描述向量表示

                 4.4   RNN  层数的影响
                    本文通过改变      RNN  的层数来观察模态融合过滤模块中            RNN  层数变化对于性能的影响, 实验结果如图             5  所
                 示. 从结果可以看出, 随着      RNN  层数增加, LSTM   和  GRU  模型的两个评价指标均出现降低的现象. 我们认为随着
                 RNN  的层数的增加, 不同的模态的实体向量表示逐渐趋于平滑, 实体之间的差异性降低, 甚至会引入噪声, 从而导
                 致模型性能的下降. 所以, 采用        1  层  RNN  网络对于多模态知识图谱补全任务就已经足够.
   188   189   190   191   192   193   194   195   196   197   198