Page 225 - 《软件学报》2025年第9期
P. 225

4136                                                       软件学报  2025  年第  36  卷第  9  期


                 因果结构图. 本文从理论保障了基于增强的条件独立性检验和最小化结构依赖可以正确找回结构中丢失的因果
                 边, 并在仿真数据和真实数据的结果进一步验证了所提出算法的正确性和有效性.


                                      Var=1                Var=10                  Var=50
                           产
                                       V 3                  V 3                     V 3
                           生
                           过     Var=1                Var=1                  Var=1
                           程
                                  V 1        V 2       V 1        V 2          V 1       V 2


                           测           V 3                  V 3                     V 3
                           试
                           结         Corr=0.40            Corr=0.049             Corr=0.021
                           果      V 1  p=0   V 2       V 1  p=0.09  V 2        V 1  p=0.68  V 2
                                      CIT 接受 V 1 , V 2  的    CIT 接受 V 1 , V 2  的  CIT 拒绝 V 1 , V 2  的
                                      因果关系                   因果关系减弱               因果关系
                                  (a) Var(V 1 )=1, Var(V 3 )=1,  (b) Var(V 1 )=1, Var(V 3 )=10,  (c) Var(V 1 )=1, Var(V 3 )=50,
                                    CIT(V 1 , V 2 )的结果    CIT(V 1 , V 2 )的结果    CIT(V 1 , V 2 )的结果
                                                              作用大小 (宽度)
                                                              相关系数 (颜色)
                                     图 1 高方差节点对其子节点与其他父节点              CIT  结果的影响

                    本文第   1  节介绍因果结构学习的相关方法和研究现状. 第               2  节介绍本文所需的基础知识, 包括因果模型和问
                 题定义. 第  3  节介绍本文提出的最大最小结构依赖的因果发现算法. 第                  4  节通过仿真实验、贝叶斯网络数据和真
                 实数据实验验证所提模型的有效性. 第            5  节全面讨论本文提出方法的局限性和一些拓展的可能性.

                 1   相关工作

                    针对非时序观测数据的因果结构学习方法主要包括基于约束、基于评分和基于函数因果模型的方法.
                    基于约束的方法主要分为全局因果结构学习                (global structure learning, GSL) 方法和从局部到全局因果结构学
                 习  (local_to_global structure learning, LGSL) 方法. 其中, GSL  方法一次性学习整个网络的因果结构. 这类方法从全
                 连接图开始, 对所有变量使用条件独立性检验确定连通性, 然后应用                     V  结构  [20] 和  Meek  规则  [21] 定向边, 从而构建
                 表示观测变量的部分有向无环图            (completed partially directed acyclic graph, CPDAG). 代表性算法包括  IC [33] 和
                 PC [20] 算法及其变体  PC_Stable [34] 等. LGSL  方法通过分解学习过程从而学习整个网络的因果结构. 这类方法首先独
                 立的确定每个变量的马尔可夫毯           (Markov blanket, MB) [35] , 并进一步将每个变量的  MB  集拼接为无向图的骨架, 随
                 后通过评分或结构识别方法定向因果边. 其代表性算法有                   GSBN [23] 、SLL+C/G [32] 和  GGSL [28] 等. 基于评分的方法
                 如  MMHC [30] 和  GES [36] 等侧重于通过定义和优化评分函数确定最佳的因果结构.
                    基于函数模型的方法主要包括线性非高斯无环模型                   (linear non-Gaussian acyclic model, LiNGAM) [37] 和非线性
                 加性噪声模型     (additive noise model, ANM) [38] , 此类方法通常要求噪声项与原因变量独立, 来保证因果方向的可靠
                 识别性  [39] . 其中, LiNGAM  模型通过主成分分析等方法求解, 其假设数据之间的关系是线性的并且噪声相互独立
                 且服从非高斯分布. ANM       模型假设数据之间的关系是非线性的, 并且噪声相互独立                  [40] .
                    上述方法对于因果结构学习在理论和实践运用中做出了巨大贡献, 但面对复杂的网络结构, 有限的样本量, 数
                 据方差差异大等问题, 算法的可靠性常受到质疑               [23−25] . 因此, 后续研究者提出了多种策略以提升算法在上述问题下
                 的实用性和准确性. 例如, Triantafillou   等人  [41] 提出  COmbINE  算法, 通过对多重干预数据集来生成符合所有输入
                 数据的因果模型概要, 以提高实际数据适用性和效率. Ng                等人  [42] 通过引入超结构估计方法和局部搜索策略, 以改
                 善在大规模线性高斯模型下基于评分的结构学习方法的可扩展性和准确性. Hyttinen                        等人  [27] 引入了  SAT  答案集
   220   221   222   223   224   225   226   227   228   229   230