Page 460 - 《软件学报》2025年第12期

P. 460

韩瑞琛等: NUMA-conscious 外键连接优化技术 5841

间逐渐增大, 而 CRVJ 算法执行时间逐渐向 FRVVJ 算法靠拢, 与 SVCRVJ 算法性能差距逐渐加大, 显示了大表排
序代价影响权重逐渐增加而内存访问延迟影响权重逐渐降低的趋势.

CRVJ FRVVJ SVCRVJ
8 000
6 000
Time (ms) 4 000
2 000

16 18 20 22 24 26 28
log(|R|)
(a) ARM(64)
8 000
6 000
Time (ms) 4 000
2 000

16 18 20 22 24 26 28
log(|R|)
(b) CLX(28)
8 000
6 000
Time (ms) 4 000
2 000

16 18 20 22 24 26 28
log(|R|)
(c) ICX(38)
8 000
6 000
Time (ms) 4 000
2 000

16 18 20 22 24 26 28
log(|R|)
(d) Milan Zen3(64)
8 000
6 000
Time (ms) 4 000
2 000
16 18 20 22 24 26 28
log(|R|)
(e) Rome Zen2(64)
图 9 FRVVJ, CRVJ 和 SVCRVJ 连接算法性能比较

26
在 Rome Zen2 和 Milan Zen3 平台上, 当 R 表记录数量低于 2 行时, SVCRVJ 算法与 FRVVJ 算法性能接近,
当 R 表增大时性能逐渐拉开差距. 在 Rome Zen2 和 Milan Zen3 平台上 FRVVJ 算法和 CRVJ 算法的性能差距较
CLX(28) 和 ICX(38) 平台上的性能更低, 两代 CPU 的核心性能差异更小.
综上所述, NUMA-conscious 的局部哈希表/向量优化策略通常只有较小的优化区间, AMD 的 Rome Zen2 和
Milan Zen3 平台上优化区间相对较大. 相对简单的细粒度复制优化策略比粗粒度复制和基于排序的粗粒度复制策
略的综合性能更高, 探测阶段的访问延迟对性能的影响高于创建阶段.

455 456 457 458 459 460 461 462 463 464 465