Page 46 - 《武汉大学学报(信息科学版)》2025年第9期
P. 46

1774                            武 汉 大 学 学 报  (信 息 科 学 版)                        2025 年 9 月














                                               图 4 基于作物类别/地块的分层示意图
                                         Fig. 4 Parcel Slice Based on Crop Types or Parcel Coding

                将对瓦片区域进行类别分层,每层生成一个标记                            巨 大 计 算 资 源 消 耗 ,受 Pseudo-3D (P3D)      [28] 、
                样本。在制作预测样本中,则对瓦片区域进行地                            ResNet3D [29] 等三维模型的启发,将常规的三维卷
                块分层,每个地块分层对应一个预测样本。通过                            积分解为二维空间卷积和一维时间卷积,提出的
                类别/地块分层,能够有效排除不同类别或地块之                           TSST 网络模型如图 5 所示。整体上,网络包括
                间的相互干扰,获取“纯净”的样本特征数据。                            空 间 嵌 入 模 块(spatial embedding block, SEB)、
                     实验过程中也注意到,瓦片分层中的空白区                         稠密空间连接模块(dense spatial block, DSB)、注
                域(数据缺失)可能会导致模型训练过程不稳定、                           意 力 模 块(channel-spatial attention, CSA)、向 量
                模型训练不收敛甚至训练失败等问题。为此,尝                            化模块(vector block, VB)和基于时域卷积网络
                试采用随机填充和正态填充两种方法对空白区域                           (temporal convolutional network,TCN)的分类模
                进行模拟填充,以期改善模型训练过程。在随机                            块等 5 个子模块。SEB 模块对输入时序影像进行
                填充中,从有效像元中随机选取像元,并将其像元                           空间包裹生成输入影像的高维特征表达;DSB 模
                值填充到缺失位置;在正态填充中,假定有效像元                           块用于提取影像的多层次空间信息;CSA 模块学
                值服从正态分布,计算其均值与标准差,进而在均                           习影像在空间和波段(属性)维度的注意力;VB
                值的 3 倍标准差范围内随机生成像元值,并填充                          模块将序列影像特征转化为多维时序信息;TCN
                到缺失位置。此外,考虑到深度学习模型对数据                            模块实现从多维时序特征到作物类别的映射,并
                缺失具有一定的容忍性,实验中只有当影像瓦片                            输出作物类别概率。
                序列的平均缺失率大于 0.6 时,才会模拟填充空白                            1) 多层次空间特征
                区域,降低其数据缺失率至低于 0.6。                                  TSST 网络模型利用 DSB 模块提取影像的
                2.4 TSST 网络模型                                    多尺度空间信息,其实现沿用了 DSNet               [30] 中的稠
                     三维卷积神经网络能够学习影像序列的时                          密膨胀卷积模块(图 5)。具体而言,DSB 利用具
                空联合信息。本文为避免直接使用三维卷积的                             有密集感受野的膨胀卷积来捕获影像空间的多


























                                                  图 5 TSST 网络模型的整体架构
                                          Fig. 5 Overall Architecture of TSST Network Model
   41   42   43   44   45   46   47   48   49   50   51