Page 64 - 《软件学报》2021年第7期
P. 64

1982                                     Journal of Software  软件学报 Vol.32, No.7,  July 2021

                    定义 5(数据采集系统)      [2729] .  数据采集系统是指感知过程定期采集感知对象状态数据所采用的系统,例如
                 用于监测负载变化情况的 Ganglia 系统         [27] ,用于监测网络、主机运行状态的 JMeter 系统         [28] ,用于监测物理基础
                 设施资源、虚拟资源的 DARGOS 系统          [29] 等.
                    定义 6(感知周期)    [30] .  感知周期是指数据采集系统获取感知对象状态数据的间隔时间.
                    其次,给出 SAFER 实现事件识别及识别过程质量保障的工作过程.如图 1 所示,其主要包含 3 部分工作:
                 ①  事件因果关系挖掘与建模;②  基于正向推理的事件识别;③  基于反向推理的变化监测.其中,工作①作为工
                 作②和③的基础,负责从系统运行日志中挖掘形成事件因果关系.工作②和③则依据该因果关系,识别事件并对
                 识别准确性和识别效率加以保障.




























                                                  Fig.1  Overview of SAFER
                                                     图 1   SAFER 概览
                    ①  事件因果关系挖掘与建模.通过序列模式挖掘算法从系统运行日志中挖掘得到事件因果关系;建立模
                        糊故障树模型以树状图结构和模糊算子描述事件因果关系,并将模糊故障树交于领域专家核查与增
                        补,避免仅依赖系统运行日志或领域知识建立事件因果关系而导致的局限性与不准确性.
                    ②  基于正向推理的事件识别.将模糊故障树通过转换规则转换为贝叶斯网络;根据软件变化与贝叶斯网
                        络中基本事件间的映射关系,判断基本事件的发生情况;利用贝叶斯网络的正向推理能力与基本事件
                        发生情况,计算中间事件至顶事件的发生概率,以此判断各层事件发生情况并保障识别的准确性.
                    ③  基于反向推理的变化监测.基于贝叶斯网络的反向推理能力和基本事件结构重要度,定量地计算与各
                        类感知对象相关的软件变化对事件发生的影响程度,抽取其中易造成事件的感知对象形成精英感知
                        集合;量化计算精英感知集合中感知对象的状态数据平稳度、状态异常程度及引发事件的后验概率,
                        动态地调整这些感知对象的感知周期,以快速发现软件变化从而保障识别效率,并避免持续高频采样
                        带来的巨大计算和存储开销.
                    基于上述工作,SAFER 可为自适应软件识别出运行环境或系统资源中发生的事件,并能够保障识别准确性
                 与效率,为确保自适应软件长期且稳定的运行提供有力的支持.
   59   60   61   62   63   64   65   66   67   68   69