Page 44 - 《武汉大学学报(信息科学版)》2025年第10期
P. 44

第 50 卷第 10 期        余   航等:接受域类型差异对多重备选假设数据探测法的影响分析                                  1979


                positioning scenarios. From the geometric perspective of partitioning of the misclosure space, the difference
                in acceptance regions will change the subspaces of the critical regions, thereby affecting the results of outlier
                detection and identification. Conclusions: Analyzing the relationship between different types of acceptance
                regions and model geometry can help improve the model geometry and reduce its impact on the probability
                of correct identification. The findings are informative for the selection of hyperellipsoid and hyperpolyhedral
                acceptance regions, when employing data snooping with multiple alternative hypotheses in scenarios where
                the a priori variance factor is known.
                Key  words:  data  snooping;  multiple  alternative  hypotheses;  testing  space;  correct  identification;  mini‑
                mum detectable bias

                    原假设和单一备选假设下,Baarda w-检验统                    检验决策概率中正确探测率与正确识别率往往
                计量是一致最大功效不变检验统计量                  [1-2] 。通过     又是确定最小可探测偏差与最小可识别偏差的
                预设的显著性水平(第Ⅰ类错误)与错误探测率                           基础。虽然利用超椭球和超多面体接受域进行
               (第Ⅱ类错误),并根据 Baarda w-检验统计量满足                     观测值粗差探测与识别的应用广泛,但是接受域
                一维正态分布的特点,可确定粗差探测的接受域                           类型差异对多重备选假设数据探测法的影响缺
                及 最 小 可 探 测 偏 差(minimal  detectable  bias,      乏分析。
                MDB)。因仅存在单一备选假设,该接受域为实                              因此,本文基于残差型和闭合差型 Baarda w-
                轴上的一段区间。但在实际应用中,由于事先无                           检验统计量,首先总结超椭球和超多面体接受域
                法知晓观测值粗差的具体位置,常建立多重备选                           下 3 种检验决策概率的计算方法,给出基于残差
                假设,并结合数据探测法一次假定一个观测值存                           型 w-统计量检验空间划分的统一表达式;然后,
                在粗差   [3-4] 。多重备选假设数据探测法还需考虑                    以二维闭合差的检验空间为基础,揭示不同接受
                错误识别率(第Ⅲ类错误),其 Baarda w-检验统计                    域类型导致的正确识别率差异与函数模型几何
                量实则服从高维正态分布。而在多重备选假设                            间的对应关系;最后,以直接平差、平面测边网及
                下,目前并无最优的检验统计量               [2,4] ,通常依据探       单点定位模型为例,给出闭合差 w-统计量检验空
                测、识别与调节改正框架,先构建粗差探测的接                           间划分结果,并结合数值模拟方法分析两类接受
                受域,探测粗差的存在,进而识别和定位粗差,并                          域的差异对 MDB 及正确识别率差异的影响。
                对含粗差观测值进行处理以估计模型参数(调节
                改 正)。 但 在 先 验 单 位 权 方 差 因 子 已 知 的 条 件           1 Baarda w-检验统计量的构建
                下,多重备选假设数据探测法既可依据原假设下
                                                                1.1 残差型 Baarda w-检验统计量          [3]
                残差加权平方和满足中心化卡方分布的特点构
                                                                    设原假设模型为:
                建超椭球体接受域         [2,4-14] ,也可根据各备选假设对
                                                                                              2         (1)
                应 的 Baarda w-检 验 统 计 量 构 建 超 多 面 体 接 受                 H 0: E ( y )= Ax, D ( y )= σ 0 Q y = Σ y
                                                                            m
                域 [3,14-23] ,两种方式均有广泛应用。不同接受域的                  式 中 , y ∈ R 为 满 足 正 态 分 布 的 观 测 向 量 ;
                                                                                                n
                选择必然会对粗差探测与识别的结果产生影响,                           A ∈ R m × n  为列满秩系数矩阵; x ∈ R 为模型参数
                                                                                                       2
                体现在两个方面:(1)不同类型接受域影响检验                          向量; E ( )、 D ( )分别为期望和方差运算符; σ 0 表示
                统计量所属的检验空间。Baarda w-检验统计量                       已知的先验单位权方差因子; Q y 为 y 协因数阵;
                既 可 由 残 差 进 行 构 建   [2,4,10] ,也 可 通 过 闭 合 差 构   Σ y 表示观测向量 y 的协方差阵。
                建 [3,18-19] 。但无论采用何种形式的检验统计量,其                      设平差模型中只存在单个粗差,数据探测法
                本质是找到统计量所属检验空间的子空间。因                            将粗差归入函数模型,认为粗差与正常观测值的
                此,与接受域相邻的各邻域子空间必受到接受域                           方差相同而期望不同,进而利用统计检验探测并
                类型差异所带来的影响,进而影响粗差探测与识                           剔 除 粗 差  [23] 。 因 此 ,可 构 建 如 下 m 个 备 选 假 设
                别的结果。(2)不同类型接受域影响检验决策概                          模型:
                率的大小。检验决策概率的计算实则是检验统                                  H i: E ( y )= Ax + c i ∇ i, D ( y )= Σ y, i =
                计量的概率密度函数在检验子空间上的积分运                                               1,2,⋯,m              (2)
                算 [2-3] ,不同接受域对应的子空间不同,积分区域                     式中 , c i 表示第 i 个元素为 1、其余为 0 的单位向
                的大小也就不同,导致检验决策概率结果不同。                           量; ∇ i 表示粗差。因此, c i ∇ i 对应第 i 个观测值的
   39   40   41   42   43   44   45   46   47   48   49