Page 259 - 《软件学报》2025年第12期
P. 259

5640                                                      软件学报  2025  年第  36  卷第  12  期


                 联上. 其中的原因可能是实体会从几跳之内的受欢迎实体的丰富的信息中得到更多的信息增益, 而不是长尾实体.
                 然而, 将一个实体和远距离相连的长尾实体关联上能够使得它聚合到长尾实体的稀疏信息, 而这种稀疏信息很难
                 通过局部或全局视角聚合到. 因此, 该策略又会优于随机采样策略.


                      Allen Iverson           Golden State Warriors         Cross-country skiing
                     Dwyane Wade                 New York Knicks                 Alpine skiing
                      Lamar Odom                   Indiana Pacers                  Bobsleigh
                      Kevin Garnett            Los Angeles Clippers       Track and field athletics
                   Shaquille O’ Neal          New Orleans Pelicans                 Skeleton
                        Ray Allen                 2006 NBA draft                Speed skating
                   Carmelo Anthony                 Chicago Bulls          Short track speed skating
                    Stephen Jackson                Boston Celtics                   Sailing
                     LeBron James               Philadelphia 76ers              Snowboarding
                     Magic Johnson                2005 NBA draft              Nordic combined
                                 (a) Kobe Bryant             (b) Detroit Pistons           (c) Ski jumping
                                            OS X                Electronic keyboard
                                   Microsoft Windows                     Piano
                                Solaris Operating System                 Viola
                                            Unix                         Violin
                                      Windows Vista                      Cello
                                          Android                      Mandolin
                                    Microsoft Studios                    Banjo
                                       Windows XP                     Accordion
                                         FreeBSD                    Electric piano
                                            PHP                      Harpsichord
                                                  (d) GNU/Linux                (e) Electric violin
                               图 4 半归纳式设定下, 对全局注意力机制中注意力权重最高的实体的可视化

                                                                  46
                           23.0                                   45
                         MRR (%)  22.5                          Hits@10 (%)  44
                           22.0

                           21.5                                   43
                           21.0                                   42
                                   20   40    60    80   100            20    40    60   80    100
                                             M                                    M
                                                     (a) 采样路径数 M 对模型性能的影响
                                           p u,v∝ deg(u)+deg(v)                   p u,v∝ deg(u)+deg(v)
                           23.4                  1    1                                1     1
                                           p u,v∝  +              46              p u,v ∝  +
                                               deg(u)  deg(v)                    random    deg(v)
                                                                                     deg(u)
                         MRR (%)  23.0                          Hits@10 (%)  45
                                           random
                           23.2
                           22.8                                   44
                                                                  43
                                                   (b) 边的采样概率 p u,v  对模型性能的影响
                                 图 5 全归纳式设定下, 采样路径数和边的采样概率对模型性能的影响

                  5.7   推理效率的分析
                    真实世界中, 随着知识图谱的扩充, 知识图谱补全也需要考虑到实体和三元组数的增长. 因此, 推理效率是决
                 定知识图谱补全模型是否能够落地到真实应用中的一个重要因素. 为了展现本文框架的推理效率, 本文与其他最
                 先进的归纳式方法对每个查询的推理时间进行了比较, 并在表                    6  中汇报了实验结果. 从表      6  中可以得出结论: 本文
   254   255   256   257   258   259   260   261   262   263   264