Page 460 - 《软件学报》2025年第12期
P. 460

韩瑞琛 等: NUMA-conscious 外键连接优化技术                                                  5841


                 间逐渐增大, 而    CRVJ 算法执行时间逐渐向        FRVVJ 算法靠拢, 与   SVCRVJ 算法性能差距逐渐加大, 显示了大表排
                 序代价影响权重逐渐增加而内存访问延迟影响权重逐渐降低的趋势.

                                                      CRVJ    FRVVJ    SVCRVJ
                               8 000
                               6 000
                              Time (ms)  4 000
                               2 000

                                        16      18     20      22      24      26      28
                                                              log(|R|)
                                                            (a) ARM(64)
                               8 000
                               6 000
                              Time (ms)  4 000
                               2 000

                                        16      18     20      22      24      26      28
                                                              log(|R|)
                                                            (b) CLX(28)
                               8 000
                               6 000
                              Time (ms)  4 000
                               2 000

                                        16      18     20      22      24      26      28
                                                              log(|R|)
                                                             (c) ICX(38)
                               8 000
                               6 000
                              Time (ms)  4 000
                               2 000

                                       16      18      20      22      24     26      28
                                                              log(|R|)
                                                          (d) Milan Zen3(64)
                               8 000
                               6 000
                              Time (ms)  4 000
                               2 000
                                       16      18      20      22     24      26      28
                                                             log(|R|)
                                                          (e) Rome Zen2(64)
                                         图 9 FRVVJ, CRVJ 和  SVCRVJ 连接算法性能比较

                                                                   26
                    在  Rome Zen2  和  Milan Zen3  平台上, 当  R  表记录数量低于  2 行时, SVCRVJ 算法与  FRVVJ 算法性能接近,
                 当  R  表增大时性能逐渐拉开差距. 在        Rome Zen2  和  Milan Zen3  平台上  FRVVJ 算法和  CRVJ 算法的性能差距较
                 CLX(28) 和  ICX(38) 平台上的性能更低, 两代    CPU  的核心性能差异更小.
                    综上所述, NUMA-conscious 的局部哈希表/向量优化策略通常只有较小的优化区间, AMD                     的  Rome Zen2  和
                 Milan Zen3  平台上优化区间相对较大. 相对简单的细粒度复制优化策略比粗粒度复制和基于排序的粗粒度复制策
                 略的综合性能更高, 探测阶段的访问延迟对性能的影响高于创建阶段.
   455   456   457   458   459   460   461   462   463   464   465