Page 26 - 《武汉大学学报(信息科学版)》2025年第10期
P. 26
第 50 卷第 10 期 王乐洋等:顾及设计矩阵误差时间序列 AR 模型精度评定的 Sieve 块自助采样方法 1961
法得到的 AR 系数最终估计。 子块最多。
在获取 AR 系数均值后,将重采样过程中获 与 MBB 法、NBB 法、CBB 法相比,精度评定
̂ *
̂ *
̂ *
取的 ( β 1,β 2,⋯,β M ) 作为估值样本,采用矩法估 的 Sieve-SBB 采样方法最大的差异在于,SBB 法
计 的 思 想 原 理 获 取 AR 系 数 的 方 差 - 协 方 得到的每个中心化残差子集的块长度可能并不
差阵 [22,26,35] : 相同,其所满足的概率密度函数为几何分布,并
M
2
̂ *
D ( β )= ∑ [( β i - E ( β ) ) ] /( M - 1 ) (10) 且将迭代寻优算法获取到的最优块长度作为参
i = 1
数确定该几何分布。因此,在每循环一次 SBB 采
σ ̂ ̂ = D ( β ) i,i ( i = 1,2,⋯,p ) (11)
样的过程中,被抽样到的中心化残差子集个数由
β i
式中, D ( β )为 AR 系数的自助方差-协方差矩阵;
于受采样随机性的影响,可能并不相等。
σ ̂ ̂ 为 AR 系数的标准差。
各方法之间的差异主要集中在分块规则与
β i
从式(10)及式(11)可以看出,Sieve 块自助采
采样规则,即数据块长度是否固定、所划分的数
样方法可以用于求取顾及设计矩阵误差时间序
据块个数、数据块之间是否存在重叠、需要重采
列 AR 模型系数的方差或协方差。因此,本文将
样的子集个数,以及重采样过程中所满足的分布
该采样方法引入到 AR 模型的精度评定中,并根
等。具体而言,MBB 法和 NBB 法的计算步骤基
据分块准则和采样策略的不同,定义了 4 种精度
本相同,仅在分块规则这一部分有差异。MBB 法
评定方法。
2.3 精度评定流程 的计算步骤中的分块规则为:对中心化残差 { γ }
精度评定的 Sieve-MBB 采样方法依据最优 进行分块预处理,获取 N = m - p - l + 1 个残差
块长度将中心化残差序列划分为多个子块,并通 序列子集 { γ( i,k ) }。而 NBB 法的计算步骤中的
过对子块的有放回随机抽样得到中心化残差自 分块规则为 :对 { γ } 进行分块预处理 ,分为 N =
û
助样本,并以此构建块自助样本。每个残差子块 ë ( m - p )/l 个子集 { γ( i,k ) },其中 i=1,2,⋯,N,
被采样到的概率相等,每个块自助样本的样本容 k = l。而 CBB 法不仅在分块规则这一计算步骤
量与原始时间序列样本相同。但有放回随机抽 与 MBB 法和 NBB 法有差别之外,还比这两种方
样过程使得中心化残差自助样本可能包含某些 法 的 计 算 步 骤 多 一 步 ,即 先 将 序 列 周 期 性 延 伸
重复的子块,而另外一些数据子块并未出现。因 { y m }= { y m,y m },为 方 便 编 程 采 样 与 计 算 ,对
此,每个块自助样本将随机地异于原始序列,导 { γ }= { γ,γ }进行编号处理,然后再对 { γ,γ }进行
致每个块自助样本得到的 AR 系数估值存在细微 分块预处理,分为 N = m - p 个中心化残差序列
差异。 子集 { γ( i,k ) } (i = 1,2,⋯,N, k = l)。SBB 法的
与 MBB 采 样 方 法 类 似 ,精 度 评 定 的 Sieve- 计算步骤与其他 3 种方法在分块规则与采样规则
NBB 采样方法根据迭代法选择的最优块长度将 当中均不相同,具体描述为:采用周期性延伸序
中心化残差序列划分为多个子集,通过对子集的 列 { γ }= { γ,γ },并对其进行编码预处理;产生随
有放回随机抽样得到中心化残差自助样本并构 机数 I 4i (1 ≤ i),概率密度函数所附有条件为均匀
建块自助样本,根据抽样分布得到未知量的精度 分布 P ( I 4i = J )= 1/( m - p ) (1 ≤ J ≤ m - p);产
信息。但在对中心化残差序列进行分块处理时, 生概率密度函数为独立同几何分布的随机数 L i
由于依赖于受采样准则,NBB 法得到的中心化残 (1 ≤ i), L i 满足参数为 p = 1/l ( p ∈ ( 0,1 ) )的几何
差子集之间不存在重叠。 分 布 p( L i = k )= p(1 - p ) k - 1 , k = 1,2,3,⋯;对
与 MBB 法、NBB 法一致,精度评定的 Sieve- { γ }= { γ,γ } 进 行 有 放 回 随 机 抽 样 ,获 取 子 集
CBB 采样方法划分得到的每个中心化残差子集 γ( I 4i,L i );分 别 循 环 这 一 部 分 的 步 骤 γ( I 41,L 1 ),
的长度相同。但 CBB 法通过将原始时间序列或 γ( I 42,L 2 ),⋯,γ( I 4k,L k ) 次 ,获 取 子 集 γ( I 41,L 1 ),
中 心 化 残 差 序 列 进 行 周 期 性 延 伸 γ( I 42,L 2 ),⋯,γ( I 4k,L k ),直 到 满 足 条 件 L 1 +
{ y m }= { y m,y m }、 { γ }= { γ,γ },因此能够得到与样 L 2 + ⋯ + L k ≥ m - p 则终止本次重采样。而对
本容量 m 相同个数的中心化残差子集。相比于 于 块 长 度 l 的 选 取 ,本 文 采 用 文 献[36]提 出 的
其他 3 种采样方法,CBB 法得到的可供重采样的 方法。

