Page 110 - 《软件学报》2021年第10期
P. 110

3082                                 Journal of Software  软件学报 Vol.32, No.10, October 2021

                    (2)  离散化方法对时滞因果关系的影响
                    同样使用表 4 的时间序列数据集和离散化方法进行时滞因果关系学习,学习得到的时滞因果关系情况见
                 表 5.为表述上的方便,用 t表示不含有因果关系,tti 1 ,ti 2 ,…,ti k 表示因果关系:X j [t]X j [ti 1 ],X j [ti 2 ],…,
                 X j [ti k ].
                                 Table 5    Influence of different discretization methods on delay causality
                                          表 5   不同离散化方法对时滞因果关系的影响
                           变量     增减     转折      波动        突变        等距     等频    密度      聚类
                           X 1[t]   tt1,t2   tt1   tt1,t2  tt1   t   tt1  t   tt7
                           X 2[t]   tt1,t2   t   tt2   tt1,t2   t   t   t     t
                           X 3[t]   tt1,t2   tt1   tt1,t2  tt1,t3   t   t   t   t
                           X 4[t]   tt1,t2   tt1   tt1,t2  tt1   t   t   tt1   t
                           X 5[t]   tt1,t2   t   tt1,t2  t   t      t    t     t
                           X 6[t]   tt1,t2   tt1   tt1,t2  tt1,t8   t   t   t   tt9
                           X 7[t]   tt1,t2   tt1   tt2   tt1,t4   t   t   t   tt7
                           X 8[t]   tt1,t2   t   t   tt1,t4,t9  tt1,t8  t   t   tt1,t8
                           X 9[t]   tt1,t2   tt1   tt2   tt1,t3   t   t   t   tt5
                           X 10[t]   tt1,t2   tt1   tt1,t2  tt1   t   t   t   t
                           X 11[t]   tt1   tt1   t    t      tt1,t4  tt2  t   tt1
                           X 12[t]   tt1,t2   tt1   tt1,t2  tt1   t   t   t   tt7
                           X 13[t]   tt1   tt1   tt1   tt1,t6   t   t   t     t
                           X 14[t]   tt1,t2   tt1   tt1,t2  tt1,t2   t   t   t   t
                           X 15[t]   tt1,t2   tt1   tt1,t2  tt1,t6   t   t   t   tt3
                           X 16[t]   tt1,t2   tt1   tt1,t2  tt1,t7   t   t   t   t

                    表 5 显示:
                       离散化方法对时滞因果关系影响较大,尤其是结构离散化方法,使学习得到的因果关系基本没有实际
                        意义(离散化没有考虑时序变化因素);
                       在模式离散化中,因果关系的变化也比较大,从模式离散化的整体来看,只有 tt1 相对比较稳定.因此,
                        对于新的模式离散化方法,除 tt1 之外,不宜做其他的因果关系推断.
                 4    结论和进一步的工作

                    本文通过时间序列预处理、转换数据集构建、时序变量的排序、局部贪婪打分-搜索和最大似然参数估计
                 等给出了时间序列的因果关系学习方法,在此基础上,再将时间序列段的因果关系结构学习、因果关系结构数
                 据集构建、因果关系变量的排序、局部贪婪打分-搜索、最大似然参数估计和最大后验参数估计等相结合,建
                 立了元因果关系学习方法,从而可以实现时间序列数据集两个层次的因果关系学习.
                    在转换数据集中,
                       把纵向时滞依赖转化为横向非时滞依赖,这样便可以忽略记录之间存在的时序影响,从而实现了时滞
                        与非时滞信息的整合与统一,使基于转换的数据集能够有效地进行时滞、非时滞和混合因果关系学习
                        以及因果推理计算;
                       结合滑动平均初始化、最大似然树与 Gibbs 抽样的丢失数据迭代修复,可使学习得到的因果关系更加
                        可靠;
                       基于时间序列段模式的离散化,使学习得到的因果关系更具有实际意义、可理解性和针对性;
                       将专家经验与变量删除法相结合的时序变量排序,一方面实现了主观与客观知识的结合与互补,并可
                        避免现有的只使用专家知识(变量多时排序困难)或数据(结果不便于解释)排序变量所带来的问题;而
                        在变量排序基础上的因果关系学习,也具有更高的效率和可靠性;
                       通过因果关系结构数据集的构建,时间序列段的因果关系结构被转化为数据集中的记录,因果关系变
                        成了随机变量,从而使建立在因果关系结构数据集之上的元因果关系能够进行因果关系的不确定性
                        研究.
   105   106   107   108   109   110   111   112   113   114   115