Page 440 - 《软件学报》2025年第12期
P. 440

软件学报 ISSN 1000-9825, CODEN RUXUEW                                        E-mail: jos@iscas.ac.cn
                 2025,36(12):5821−5850 [doi: 10.13328/j.cnki.jos.007411] [CSTR: 32375.14.jos.007411]  http://www.jos.org.cn
                 ©中国科学院软件研究所版权所有.                                                          Tel: +86-10-62562563



                                                             *
                 NUMA-conscious 外键连接优化技术

                 韩瑞琛  1,2,3 ,    张延松  1,2,3,4 ,    刘    专  5 ,    张    宇  6 ,    焦    敏  3 ,    王    珊  1,2,3


                 1
                  (数据库与商务智能教育部工程研究中心, 北京 100872)
                  (数据工程与知识工程教育部重点实验室          (中国人民大学), 北京 100872)
                 2
                 3
                  (中国人民大学 信息学院, 北京 100872)
                 4
                  (中国人民大学 中国调查与数据中心, 北京 100872)
                  (英特尔  (中国) 有限公司, 北京 100190)
                 5
                 6
                  (国家卫星气象中心, 北京 100081)
                 通信作者: 张延松, E-mail: zhangys_ruc@hotmail.com
                 摘 要: NUMA (non-uniform memory access) 是现代多核、多路处理器平台上主流的内存访问架构, NUMA                 访问
                 延迟对数据库的查询性能有较大影响, 因此如何降低查询处理中跨                      NUMA  节点的访问延迟是现代内存数据库查
                 询优化的热点问题之一. 不同的处理器在             NUMA  架构、NUMA    延迟等方面差异较大, 因此         NUMA  优化技术需要
                 与硬件特性相结合. 基于内存数据库执行代价最高和对数据局部性依赖最强的内存外键连接算法, 面向代表性的
                 ARM、Intel CLX、Intel ICX、AMD Zen2   和  AMD Zen3  这  5  个处理器  NUMA  架构和延迟特征, 探索了不同
                 NUMA  优化方法, 包括    NUMA-conscious 和  NUMA-oblivious 实现技术. 在数据存储、数据分片、连接中间结果缓
                 存等方面采用不同的优化方案, 比较了不同处理器架构上的算法性能, 实验结果表明, NUMA-conscious 优化策略
                 需软、硬件相结合, 其中       Radix Join  对  NUMA  延迟敏感度为中性, 在   5  个不同的处理器平台上, NUMA       优化性能
                 收益稳定在     30%  左右, NPO  算法对  NUMA  延迟敏感度较高, 在不同平台          NUMA   优化性能收益在      38%–57%,
                 Vector Join  算法对  NUMA  延迟敏感但影响幅度较小, NUMA       优化性能收益在      1%–25%  之间, 且在算法性能特征
                 上, Vector Join  受  cache 效率影响比  NUMA  延迟影响更大; NUMA-conscious 优化技术在   ARM  平台差异较大, 在
                 x86  平台差异极小, NUMA-oblivious 算法复杂度更低, 具有较好的通用性. 从处理器硬件发展趋势来看, 降低
                 NUMA  访问延迟可以有效地降低不同           NUMA-conscious 优化算法的性能差异, 简化连接算法的复杂度, 提高连接
                 操作性能.
                 关键词: NUMA   架构; NUMA   感知优化; 非   NUMA  感知实现; 向量连接; 连接基准
                 中图法分类号: TP311

                 中文引用格式: 韩瑞琛, 张延松, 刘专, 张宇, 焦敏, 王珊. NUMA-conscious外键连接优化技术. 软件学报, 2025, 36(12): 5821–5850.
                 http://www.jos.org.cn/1000-9825/7411.htm
                 英文引用格式: Han RC, Zhang YS, Liu Z, Zhang Y, Jiao M, Wang S. NUMA-conscious Foreign Key Join Optimization Technique.
                 Ruan Jian Xue Bao/Journal of Software, 2025, 36(12): 5821–5850 (in Chinese). http://www.jos.org.cn/1000-9825/7411.htm

                 NUMA-conscious Foreign Key Join Optimization Technique
                                                         5
                                                                    6
                                                                            3
                 HAN Rui-Chen 1,2,3 , ZHANG Yan-Song 1,2,3,4 , LIU Zhuan , ZHANG Yu , JIAO Min , WANG Shan 1,2,3
                 1
                 (Engineering Research Center of Database and Business Intelligence, Ministry of Education, Beijing 100872, China)
                 2
                 (Key Laboratory of Data Engineering and Knowledge Engineering (Renmin University), Ministry of Education, Beijing 100872, China)
                 3
                 (School of Information, Renmin University of China, Beijing 100872, China)


                 *    基金项目: 国家重点研发计划  (2023YFB4503600); 国家自然科学基金  (U23A20299, 62172424, 62276270, 62322214)
                  收稿时间: 2024-09-29; 修改时间: 2024-12-22, 2025-01-25; 采用时间: 2025-02-12; jos 在线出版时间: 2025-07-17
                  CNKI 网络首发时间: 2025-07-18
   435   436   437   438   439   440   441   442   443   444   445