Page 290 - 《软件学报》2021年第8期
P. 290

2572                                   Journal of Software  软件学报 Vol.32, No.8,  August 2021

                 拓扑内的任务正常执行.其原因为:集群内数据库的读写过于缓慢而延后了 ERDM 的触发时机,进而影响集群拓
                 扑内的任务执行效率,造成影响集群性能的问题.综上所述,时间窗口的取值设置为 30s,在该时间窗口下能够较
                 好满足实验的执行.此外,同理可得 Sol、RollingSort 以及 RollingCount 的时间窗口取值.

                 4.2   数据迁移有效性测试
                    为便于观察集群内数据迁移完成后,关键节点的资源占用情况,首先需要确定集群内的节点类型,即关键节
                 点与非关键节点.根据表 1 可知,共存在 16 个工作节点.为查找集群内关键节点与非关键节点的分布情况,则通
                 过 Storm UI 检测集群执行 4 个基准测试后的实验结果,具体实验结果如图 7 所示.

                                         16      关键节点
                                                 非关键节点
                                         14
                                         12
                                         10
                                        节点数  8

                                          6
                                          4
                                          2
                                          0
                                             WordCount   Sol    RollingSort  RollingCount
                                                           基准测试
                                        Fig.7    Node distribution under different benchmarks
                                             图 7   不同基准测试下的节点分布情况
                    由图 7 可以看出:集群执行不同的基准测试关键节点与非关键节点分布并不相同,WordCount 下集群存在 2
                 个非关键节点与 14 个关键节点,Sol 下集群存在 3 个非关键节点与 13 个关键节点,RollingSort 下集群存在 2 个
                 非关键节点与 14 个关键节点,RollingCount 下集群存在 2 个非关键节点与 14 个关键节点.此外,为对比数据迁移
                 完成后,各工作节点资源占用率的变化,需要对原集群各工作节点的资源占用率进行检测,具体结果如图 8 所示.
                  90                            90                           90
                       WordCount                     WordCount                    WordCount
                  80   Sol                      80   Sol                     80   Sol
                       RollingSort                   RollingSort                  RollingSort
                  70   RollingCount             70   RollingCount            70   RollingCount
                  60                            60                           60
                  CPU占用率/%  50                 网络带宽占用率/%  50                内存占用率/%  50
                                                40
                  40
                                                                             40
                  30
                                                                             20
                                                20
                  20                            30                           30
                  10                            10                           10
                   0                            0                            0
                    1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16
                               工作节点                         工作节点                         工作节点
                          (a) CPU 占用率                       (b)  网络带宽占用率                       (c)  内存占用率
                                   Fig.8    Resources utilization of 16 work nodes in the original cluster
                                           图 8   原集群 16 个工作节点的资源占用率
                    图 8 为原集群运行 4 个基准后,16 个工作节点(关键节点和非关键节点)的平均资源占用率.如图 8 所示,原
                 集群 16 个工作节点 3 类资源的平均占用率主要集中在 50%~70%,这为集群执行数据迁移奠定了基础.数据迁移
                 完成后,各基准测试根据节点分布对 16 个工作节点资源占用率的平均值进行观测,验证资源约束算法的实际效
   285   286   287   288   289   290   291   292   293   294   295