Page 264 - 《软件学报》2021年第11期
P. 264

3590                                Journal of Software  软件学报 Vol.32, No.11, November 2021






















                                    Fig.11    Update time vs. the number of the upper B+ tree updates
                                          图 11   上层索引更新次数与更新时间的关系

                 5.4   WB-Index索引构建性能评估
                    本实验在 20s 的时间窗口,通过模拟不同数据流速来评估 WB-Index 构建性能,并对比其包含的下层索引构
                 建、下层索引发布、上层索引更新这 3 个阶段的耗时.实验设置窗口分片数 N slice =35.
                    实验结果如图 12 所示,从中可得:WB-Index 索引构建效率与数据流速呈线性关系,下层索引发布过程由于
                 存储网络 IO,耗时较长.因此,提高节点间带宽能有效提高 WB-Index 构建性能.























                                  Fig.12    Construction delay of WB-Index vs. the varying stream rates
                                         图 12   数据流流速与 WB-Index 构建时延的关系
                    如上文所述,CG-Index 和 LSM-树模型均能应用于分布式场景,属于分布式索引结构.本实验模拟不同的数
                 据流速,对比 LSM-树、CG-Index 和 WB-Index 这三者的构建效率.为了保证实验具有可比性,模拟的数据流持续
                 时间为 100s,CG-Index 中分配 10 个节点用于存储,设置 LSM-树模型中触发转储的内存阈值为 200 万条数据.
                 WB-Index 窗口时长 Tw=20,分片数 N slice =35.
                    图 13 为具体实验结果,从中可得:相比于 LSM-树和 CG-Index,WB-Index 的构建性能更优;在大流速的场景,
                 其性能优势更加明显.CG-Index 将数据流存储在多个节点上,并在对应节点构建 Local Index.但随着数据量的不
                 断增长,Local Index 的更新开销会快速增加,在大规模的数据场景下,存在性能瓶颈.LSM-树模型实时写入数据,
   259   260   261   262   263   264   265   266   267   268   269