Page 264 - 《软件学报》2021年第11期
P. 264
3590 Journal of Software 软件学报 Vol.32, No.11, November 2021
Fig.11 Update time vs. the number of the upper B+ tree updates
图 11 上层索引更新次数与更新时间的关系
5.4 WB-Index索引构建性能评估
本实验在 20s 的时间窗口,通过模拟不同数据流速来评估 WB-Index 构建性能,并对比其包含的下层索引构
建、下层索引发布、上层索引更新这 3 个阶段的耗时.实验设置窗口分片数 N slice =35.
实验结果如图 12 所示,从中可得:WB-Index 索引构建效率与数据流速呈线性关系,下层索引发布过程由于
存储网络 IO,耗时较长.因此,提高节点间带宽能有效提高 WB-Index 构建性能.
Fig.12 Construction delay of WB-Index vs. the varying stream rates
图 12 数据流流速与 WB-Index 构建时延的关系
如上文所述,CG-Index 和 LSM-树模型均能应用于分布式场景,属于分布式索引结构.本实验模拟不同的数
据流速,对比 LSM-树、CG-Index 和 WB-Index 这三者的构建效率.为了保证实验具有可比性,模拟的数据流持续
时间为 100s,CG-Index 中分配 10 个节点用于存储,设置 LSM-树模型中触发转储的内存阈值为 200 万条数据.
WB-Index 窗口时长 Tw=20,分片数 N slice =35.
图 13 为具体实验结果,从中可得:相比于 LSM-树和 CG-Index,WB-Index 的构建性能更优;在大流速的场景,
其性能优势更加明显.CG-Index 将数据流存储在多个节点上,并在对应节点构建 Local Index.但随着数据量的不
断增长,Local Index 的更新开销会快速增加,在大规模的数据场景下,存在性能瓶颈.LSM-树模型实时写入数据,