Page 46 - 《武汉大学学报（信息科学版）》2025年第9期

P. 46

1774 武汉大学学报（信息科学版） 2025 年 9 月

图 4 基于作物类别/地块的分层示意图
Fig. 4 Parcel Slice Based on Crop Types or Parcel Coding

将对瓦片区域进行类别分层，每层生成一个标记巨大计算资源消耗，受 Pseudo-3D （P3D）［28］、
样本。在制作预测样本中，则对瓦片区域进行地 ResNet3D ［29］等三维模型的启发，将常规的三维卷
块分层，每个地块分层对应一个预测样本。通过积分解为二维空间卷积和一维时间卷积，提出的
类别/地块分层，能够有效排除不同类别或地块之 TSST 网络模型如图 5 所示。整体上，网络包括
间的相互干扰，获取“纯净”的样本特征数据。空间嵌入模块（spatial embedding block， SEB）、
实验过程中也注意到，瓦片分层中的空白区稠密空间连接模块（dense spatial block， DSB）、注
域（数据缺失）可能会导致模型训练过程不稳定、意力模块（channel-spatial attention， CSA）、向量
模型训练不收敛甚至训练失败等问题。为此，尝化模块（vector block， VB）和基于时域卷积网络
试采用随机填充和正态填充两种方法对空白区域（temporal convolutional network，TCN）的分类模
进行模拟填充，以期改善模型训练过程。在随机块等 5 个子模块。SEB 模块对输入时序影像进行
填充中，从有效像元中随机选取像元，并将其像元空间包裹生成输入影像的高维特征表达；DSB 模
值填充到缺失位置；在正态填充中，假定有效像元块用于提取影像的多层次空间信息；CSA 模块学
值服从正态分布，计算其均值与标准差，进而在均习影像在空间和波段（属性）维度的注意力；VB
值的 3 倍标准差范围内随机生成像元值，并填充模块将序列影像特征转化为多维时序信息；TCN
到缺失位置。此外，考虑到深度学习模型对数据模块实现从多维时序特征到作物类别的映射，并
缺失具有一定的容忍性，实验中只有当影像瓦片输出作物类别概率。
序列的平均缺失率大于 0.6 时，才会模拟填充空白 1）多层次空间特征
区域，降低其数据缺失率至低于 0.6。 TSST 网络模型利用 DSB 模块提取影像的
2.4 TSST 网络模型多尺度空间信息，其实现沿用了 DSNet ［30］中的稠
三维卷积神经网络能够学习影像序列的时密膨胀卷积模块（图 5）。具体而言，DSB 利用具
空联合信息。本文为避免直接使用三维卷积的有密集感受野的膨胀卷积来捕获影像空间的多

图 5 TSST 网络模型的整体架构
Fig. 5 Overall Architecture of TSST Network Model

41 42 43 44 45 46 47 48 49 50 51