Page 75 - 《水产学报》2026年第04期
P. 75

4 期           刘尊雷,等:基于多源数据与            INLA-贝叶斯时空模型的东海小黄鱼           CPUE  标准化            50 卷

                    非线性效应  在        CPUE  标准化研究中,为             的数据集    y −i 条件下的预测分布。LCPO          值越小,
              准确反映环境因子与小黄鱼资源分布之间的复杂                            表明模型的预测能力越强。
              关系,除线性模型外,还采用二阶随机游走过程                                将上述过程筛选的最优模型作为基准模型,
              代表环境变量的非线性效应。对于每个环境变量                            进一步比较了       Gamma 和  Lognormal 这两种分布类
              (温度、盐度、水深和离岸距离),inla.group( ) 函数                 型对模型预测能力的影响。由于                DIC、WAIC    等
              将每个连续环境变量离散化为               10  个等间距节点,          指标的计算依赖于似然值,而不同分布类型使用
              随后为每个节点的系数赋予             RW2  先验分布。这种            了不同的似然函数,因此不能直接比较                     DIC  或
              先验结构通过对相邻节点系数的二阶差分施加惩                            WAIC  的大小来决定分布类型。采用决定系数                 (R )、
                                                                                                        2
              罚,确保最终拟合的环境响应曲线具有足够的平                            均方根误差      (RMSE) 和平均绝对误差         (MAE) 3  个
              滑性,同时设置标准化方差结构,提高模型收敛                            基于预测精度的指标评估模型预测性能。通过交
              性和稳定性。                                           叉验证计算指标,确保评估结果的稳健性,选择
                    先验设定与模型评估  模型计算采用                    R     具有较高    R 值及较低     RMSE  和  MAE  的分布类型。
                                                                        2
              语言中的     INLA  包实现,该包专门用于贝叶斯层                         模型诊断与验证  通过名义                CPUE  与预
              次模型的近似推断。在空间网格构建方面,使用                            测  CPUE  关系评估模型的表现一致性,分析环境
              三角剖分方法生成计算网格,按照                 Zuur 等 [29]  的方  变量与残差关系识别可能存在的非线性关系遗漏
              法,将内网格与外网格的分辨率设定为                   1∶5。截        或模型设定错误。空间随机效应分布用于验证模
              断距离为     0.1  度,确保网格既能捕捉空间细节又                    型设定的合理性,如果随机效应呈现出明显的空
              保持计算效率。固定效应参数均采用均值为零、                            间结构模式,说明模型成功分离了空间自相关性;
              方差为    100  的高斯先验分布,该分布近似于无信                     而如果出现不合理的斑块状或极端值分布,则可
              息先验,对后验分布影响较小。空间随机场参数                            能提示模型设定存在问题或数据存在异常。
              则采用惩罚复杂度先验分布。距离范围                    r 的先验            空间预测与可视化  空间随机效应反映了
              设定为    r < 100 km = 0.001,意味着当两个地点之              模型的空间异质性模式,揭示未被环境变量解释
              间的距离远大于        100 km 时,它们之间的空间相关                的、纯粹由空间位置决定的小黄鱼分布格局。根
              性可以忽略不计。                                         据最优模型输出结果,提取空间随机场的后验均
                   采用偏差信息准则         (DIC)、渡边-赤池信息准             值,对于每一个年份,将对应年份的场值从网格
              则  (WAIC) 和对数条件预测序数          (LCPO) 判断模型         节点映射到一个规则分辨率为               100×100  的投影栅
              性能。DIC     用于平衡模型复杂度和拟合优度,依                      格上,并将栅格数据转换为包含经度、纬度及场
              赖于后验均值,并且假设后验分布近似正态。                             值的数据框进行绘图。
              WAIC  是基于后验分布,不依赖于点估计,因此
              更适用于非正态的后验。计算公式:                                  2    结果

                                                        (6)
                  DIC = D(θ)+2p D
                                                                2.1    模型选择和验证
              式中,    D(θ)是在后验均值处的偏差;            p D 为马尔可
              夫链中估计的有效参数数量。                                        基于商业捕捞渔业数据的模型结果显示,采
                                                               用独立空间随机效应、线性形式且包含网具与环
                            ∑  n
                  WAIC = −2      lnE[p(y i |θ,y)]+2p WAIC  (7)
                               i=1                             境变量交互项的        M1  模型表现出最优的拟合性能,
                       n     [        ]
                     ∑
              式中,         lnE p(y i | θ,y)   为每个观测点后验期         其  DIC、WAIC、LCPO     值分别为     7 786、7 838  和
                       i=1
              望似然对数的和,以自然数为底;                 2p WAIC 为模型      15.59,在所有模型中均为最低          (表  2)。相比之下,空
              的有效参数个数。                                         间随机效应非线性         M2  模型  (DIC=7 802,WAIC=
                   LCPO  是留一法交叉验证在贝叶斯框架下的                      7 849) 拟合性能略有下降,而不包含网具与环境
              实现,反映了模型的预测准确性,计算公式:                             变量交互项的线性模型            M3  和非线性模型      M4  均
                           1  ∑ n                              次于  M1  模型。当采用共享空间随机效应时,无
                  LCPO = −        ln[p(y i |y −i )]     (8)
                           n   i=1                             论是否包含线性或非线性成分以及交互项,模型
              式中,    p(y i | y −i )表示第  i 个观测值在排除  i 观测后       拟合性能均显著低于独立空间随机效应模型。

              中国水产学会主办  sponsored by China Society of Fisheries                          https://www.china-fishery.cn
                                                            5
   70   71   72   73   74   75   76   77   78   79   80