Page 459 - 《软件学报》2025年第12期
P. 459
5840 软件学报 2025 年第 36 卷第 12 期
FRVVJ Vector Join Vector Join --basic-numa
2 000
1 500
Time (ms) 1 000
500
16 18 20 22 24 26 28
log(|R|)
(a) ARM(64)
2 000
Time (ms) 1 000
1 500
500
16 18 20 22 24 26 28
log(|R|)
(b) CLX(28)
2 000
1 500
Time (ms) 1 000
500
16 18 20 22 24 26 28
log(|R|)
(c) ICX(38)
2 000
Time (ms) 1 000
1 500
500
16 18 20 22 24 26 28
log(|R|)
(d) Milan Zen3(64)
2 000
Time (ms) 1 000
1 500
500
16 18 20 22 24 26 28
log(|R|)
(e) Rome Zen2(64)
图 8 向量连接和 FRVVJ 连接算法性能比较
图 9 对比了细粒度向量复制连接算法 FRVVJ, 粗粒度向量复制连接算法 CRVJ 和基于排序的粗粒度向量复
制连接算法 SVCRVJ 的性能, 各连接算法性能在不同 CPU 平台上呈现出不同的性能特征.
在 ARM(64) 平台上, 当 R 表记录数低于 2 行时, FRVVJ 算法与 SVCRVJ 算法性能相近, 但与 CRVJ 算法性
22
能有较大差异. 当 R 表记录数量超过 2 行时, CRVJ 算法性能优于 SVCRVJ 算法, 且 SVCRVJ 算法与 FRVVJ 算
26
法性能之间的差异较其他 4 个 x86 平台更大, 其主要原因是 ARM 平台具有较大的 cache 和内存访问延迟对性能
产生影响.
24
在 CLX(28) 和 ICX(38) 平台上, 当 R 表记录数量低于 2 时, FRVVJ 算法和 SVCRVJ 算法的性能相近, 而
CRVJ 算法执行时间约为 FRVVJ 算法和 SVCRVJ 算法的 2 倍. 主要原因是当 R 表较小时, 连接性能的主要影响因
素为向量探测延迟, CRVJ 算法的多入口探测延迟对连接性能影响较为显著. 随着 R 表增大, SVCRVJ 算法执行时

