Page 275 - 《软件学报》2026年第1期

P. 275

272 软件学报 2026 年第 37 卷第 1 期

3 数据库高可用研究的挑战和趋势

数据库高可用性的研究是一个动态发展的领域, 随着技术进步和业务需求的演变, 新的挑战和趋势不断出现.
随着云计算和分布式系统的广泛应用, 数据库高可用性研究面临的挑战和趋势也日益复杂和多样化.
随着服务器和存储设备的复杂性增加, 硬件故障的诊断和恢复变得更加困难, 研究需要关注如何利用预测性
维护和自动化工具来提前识别和修复硬件问题. 同时, 数据库系统对网络的依赖性越来越高, 网络故障可能导致数
据同步延迟和访问中断, 研究应关注如何设计更加健壮的网络架构和协议, 以减少单点故障和提高网络恢复速度.
云环境的动态性以及多租户特性也给数据库的高可用性带来了新的挑战, 如资源争用和隔离性问题, 云原生数据
库通过微服务架构、容器化技术等实现了高度的灵活性和可扩展性, 然而, 在支持动态扩展的同时保证系统的高
可用性仍然存在困难, 尤其是在多租户环境和多云部署中, 跨区域的数据复制、同步、故障恢复等问题变得更加
复杂.
通过智能化的故障检测与恢复, 利用机器学习算法分析系统日志和性能指标, 实现故障的预测和自动恢复. 人
工智能正在逐渐渗透到数据库管理系统中, AI 技术可以用于预测系统故障、优化负载平衡、自动化故障恢复等.
未来, 基于 AI 的数据库管理系统有望实现更高水平的自治, 减少人工干预, 提高系统的鲁棒性和可用性, 研究如何
使数据库系统能够根据实时数据和负载情况自适应地调整配置和资源分配, 以提高可用性. 随着企业在多个云平
台上部署应用的需求增加, 多云数据库的高可用性研究将成为重点, 如何在不同的云环境中高效管理数据复制、
同步以及处理跨云的故障转移, 是未来研究的重要方向. 为了满足特定应用场景的高可用性需求, 设计符合行业标
准的高可用性解决方案, 为特定应用场景提供定制化的数据库服务, 如物联网设备的实时数据处理和分析.
4 数据库高可用技术建议

本节提供实现数据库高可用性的一系列技术建议, 涵盖存储、参数配置、查询优化和事务等关键方面. 存储
部分介绍现有的一些典型数据库使用的存储方法以及可靠的存储设备和技术, 以确保数据的持久性和快速访问;
参数配置部分列举一些数据库系统中配置参数的调整方法, 以优化系统性能和稳定性; 查询优化部分分析现有针
对查询优化领域研究的不足, 并对此提出合理的建议; 事务部分主要说明在分布式数据库架构中各种一致性协议
在事务处理中的应用及其面临的挑战. 其中, 存储和参数配置是数据库系统性能的基础, 事务和查询优化提升了系
统的响应速度和数据一致性.
4.1 存储
良好的数据分区技术能够帮助故障快速恢复, 从而构建高可用、可扩展的存储架构. 现在的商业数据库大多
通过基于 Hash 的数据分区方式来实现分布式存储. 例如: TBase 通过复制表和 Hash 分布技术进行数据冗余存储;
达梦数据库采用非对称数据分片技术将数据进行分布式存储. 虽然避免了单节点存储过多数据的问题, 但数据分
区仅由数据驱动, 当机器发生故障时, 如果工作负载涉及的数据分布较为分散, 则会导致 RTO 过大. 为此, 可以提
出数据自适应分区技术, 采用数据驱动与查询驱动相结合的方式来减小 RTO.
通过数据智能分区选取最优分区可以降低单点故障, 重分区涉及节点间数据迁移, 好的重分区策略可以提高
备份效率, 加快数据恢复和容错查询处理, 降低 RTO; 自适应压缩提高存储空间利用率和数据传输效率, 更多的空
间可以用于备份复制、故障恢复, 更快的传输可以在数据备份与主备切换时提高响应速度, 降低 RTO.
文献 [74] 介绍了 Megastore. Megastore 是为了满足当今交互式在线服务的要求而开发的存储系统. 其以一种
新颖的方式融合了 NoSQL 数据存储的可扩展性和传统 RDBMS 的便捷性, 同时提供了强一致性保证和高可用性.
在物理上使用 BigTable 作为一个数据中心的拓展容错存储, 通过将操作分散至多行来支持随机读写吞吐. 让应用
自身控制数据安放位置来减小延迟提高吞吐量. 实现了 Paxos 复制和共识算法, 优化了跨地理分布数据中心的低
延迟操作, 为系统提供了高可用性.
文献 [75] 提出的 Dynamo 是一个高可用的键值存储系统, 不保证一致性, 不支持事务, 去中心化, 有更好的高

270 271 272 273 274 275 276 277 278 279 280