Page 465 - 《软件学报》2025年第12期
P. 465
5846 软件学报 2025 年第 36 卷第 12 期
台的 NUMA-oblivious-SSB 的平均查询时间组成中, 多表连接的时间占比都超过 84%, 所以在数据库负载的场景
下探究 NUMA-conscious 外键连接优化技术是必要且重要的. 其次, Intel 和 AMD 平台上的 NUMA-conscious-SSB
在每条查询上性能都优于 NUMA-oblivious-SSB, 由于本节实验所用到的 CPU cache 容量较大, 其中 AMD EPYC
9654 的 L3 cache 容量高达 383 MB, 而 SF=100 的 SSB 基准测试中生成最大向量大小仍处于 cache 容量内, 受 cache
访问数据延迟低的影响, 缩小 NUMA-conscious 外键连接优化技术带来的性能优化空间, 但在 Intel 平台上的平均
性能优化可达 24.6%, 在 AMD 平台上可达 14.4%, 且由图 5 可推知, 随着数据量进一步增大, NUMA-conscious 外
键连接优化技术所带来的性能提升将随之扩大, 所以在面临海量数据分析处理需求挑战的当下, 数据库系统如何
面向现代处理器的 NUMA 架构特性做连接算法优化是非常重要且亟待解决的.
表 4 执行 SSB 基准测试的 CPU 架构及硬件参数
CPU型号 类别 主频 (GHz) 核心 缓存 内存 NUMA节点数
Intel Xeon 6780E Intel® Xeon® 6 2.2 144 64 KB L1, 2 MB L2, 108 MB L3 8通道, 带宽490.8 GB/s 1
AMD EPYC 9654 EPYC 9004 Series 2.4 96 64 KB L1, 2 MB L2, 384 MB L3 12通道, 带宽434.7 GB/s 2
NUMA-conscious-SSB NUMA-oblivious-SSB
80 80
60 60
40 40
20 20
0 0
Q1.1 Q1.2 Q1.3 Q2.1 Q2.2 Q2.3 Q3.1 Q3.2 Q3.3 Q3.4 Q4.1 Q4.2 Q4.3 AVG Q1.1 Q1.2 Q1.3 Q2.1 Q2.2 Q2.3 Q3.1 Q3.2 Q3.3 Q3.4 Q4.1 Q4.2 Q4.3 AVG
维向量生成 多表连接 维向量生成 多表连接
(a) Intel
NUMA-conscious-SSB NUMA-oblivious-SSB
60 80
50
60
40
30 40
20
20
10
0 0
Q1.1 Q1.2 Q1.3 Q2.1 Q2.2 Q2.3 Q3.1 Q3.2 Q3.3 Q3.4 Q4.1 Q4.2 Q4.3 AVG Q1.1 Q1.2 Q1.3 Q2.1 Q2.2 Q2.3 Q3.1 Q3.2 Q3.3 Q3.4 Q4.1 Q4.2 Q4.3 AVG
维向量生成 多表连接 维向量生成 多表连接
(b) AMD
AVG
AMD-NUMA-oblivious-SSB 49.50
AMD-NUMA-conscious-SSB 42.36
Intel-NUMA-oblivious-SSB 51.45
Intel-NUMA-conscious-SSB 38.81
0 10 20 30 40 50 60
(c) SSB 平均查询性能对比
图 14 NUMA-conscious-SSB 和 NUMA-oblivious-SSB 性能对比

