Page 135 - 《软件学报》2025年第12期
P. 135

5516                                                      软件学报  2025  年第  36  卷第  12  期



                                       表 1 现有数据库配置参数调优方法的分类和简要描述

                      分类           配置优化系统                      特点                          应用
                     基于搜索           BestConfig [5]   通过启发式方法在配置空间中搜索                  DBMS的性能优化
                                     iTuned [6]             首次采用BO                    DBMS的性能优化
                                    OtterTune [7]    增量式旋钮、工作负载映射、GPR                 DBMS的性能优化
                     基于BO
                                    ResTune [14]        采用RGPE传递历史知识                 面向资源的DBMS调优
                                   LlamaTune [15]         低维投影、偏抽样                    DBMS的性能优化
                                    CDBTune +[2]           首次采用DDPG                   DBMS的性能优化
                                     QTune [9]             支持3种调优粒度                   DBMS的性能优化
                                    DB-BERT [16]              使用NLP                   DBMS的性能优化
                     基于RL
                                   WATuning [17]           引入注意力机制                    DBMS的性能优化
                                    HUNTER [18]          遗传算法生成样本预热                   DBMS的性能优化
                                     UDO [19]                 基于RL                    DBMS的性能优化

                  1.2   基于  BO  的方法
                    基于  BO  的方法, 将调优建模为一个黑盒优化问题, 对配置和数据库性能之间的关系进行建模. 他们遵循                             BO
                 框架来搜索最优的       DBMS  配置: (1) 拟合概率代理模型; (2) 通过最大化目标函数来选择下一个配置进行评估.
                    iTuned  首先采用  BO  模型来寻找性能良好的配置. 它使用随机抽样技术——Latin hypercube sampling            进行初
                 始化, 并且不使用从以前的调优会话中收集的观察结果来加速目标调优任务, 通过计划的实验主动引入适当的数
                 据, 探索解空间找到高影响参数和高性能参数设置, 通过周期偷窃范式降低在生产工作负载上的开销.
                            [7]
                    OtterTune 通过工作负载映射来选择重用历史数据, 通过              FA  因子分析和   K-means 聚类剪裁冗余的数据库内
                 部指标   (Metrics), 用  Lasso  暴露与系统整体性能相关性最强的旋钮, 在回归中包含多项式特征来检测旋钮之间的
                 非线性相关性和依赖性, 训练高斯过程回归              (GPR) 来为当前的工作负载推荐配置参数.
                    ResTune 定义了一个面向资源的调优问题, 并采用了约束贝叶斯优化求解器. 它使用一个集成框架                           (即  RGPE)
                 来跨调优任务组合工作负载编码器, 以传输历史知识.
                    LlamaTune 是一种利用领域知识来提高现有优化器样本效率的调谐器设计. LlamaTune 采用了一种基于随机
                 投影的自动降维技术, 一种偏采样方法来处理某些旋钮的特殊值, 以及旋钮值桶化, 以减少搜索空间的大小,
                 LlamaTune 集成了  3  个优化器: 两个基于   BO  的优化器   (SMAC, GP-BO) 和一个基于    RL  的优化器  (DDPG).
                    然而, 基于   BO  的方法存在的不足如下: 首先, 有些基于          BO  的方法  (如  OtterTune) 采用流水线式学习模型, 前
                 一阶段的最优解不能保证后一阶段的最优解, 模型的不同阶段之间可能不能很好地协同工作. 其次, 依赖于难以获
                 得的大规模高质量训练样本. 最后, 实际操作中存在大量参数, 大多数基于                     BO  的方法  (如  OtterTune 使用的  GPR)
                 是难以在高维连续空间中优化参数设置的, 并且参数位于连续空间中, 具有潜在的依赖关系, 参数的组合数量规模
                 大, 仅靠人为地在回归中包含多项式特征难以找到所有的、潜在的依赖关系.
                    目前在高维配置空间中表现最好的基于               BO  的方法是   SMAC, 而基于   SMAC  的模型训练时只能选择单一的
                 优化目标   (吞吐量或延迟等), 无法实现多目标的协同优化任务.
                  1.3   基于  RL  的方法

                    基于强化学习的方法基本采用深度确定性策略梯度                   (DDPG) 模型, 这是一种基于策略的无模型强化学习方
                 法. 它将参数调优视为在探索未知空间和利用现有知识之间进行权衡的试错过程.
                                                                               +
                    Zhang  等人  [2] 在 2019 年提出了一种端到端的数据库自动调参工具           CDBTune , 该系统使用深度确定性策略梯
                 度  (DDPG) 算法. 该深度强化学习方法是基于 Q-learning 算法演化而来, 基于贝尔曼最优方程进行迭代更新, 借助
                 神经网络不仅可以在高维连续的参数空间中优化最优配置并且可以自动考虑参数间潜在的依赖关系, 奖励函数的
                 设计同时考虑了当前参数配置的性能与初始的性能变化以及当前参数配置的性能同前一次的性能变化. 为了降低
   130   131   132   133   134   135   136   137   138   139   140