Page 46 - 《武汉大学学报(信息科学版)》2025年第9期
P. 46
1774 武 汉 大 学 学 报 (信 息 科 学 版) 2025 年 9 月
图 4 基于作物类别/地块的分层示意图
Fig. 4 Parcel Slice Based on Crop Types or Parcel Coding
将对瓦片区域进行类别分层,每层生成一个标记 巨 大 计 算 资 源 消 耗 ,受 Pseudo-3D (P3D) [28] 、
样本。在制作预测样本中,则对瓦片区域进行地 ResNet3D [29] 等三维模型的启发,将常规的三维卷
块分层,每个地块分层对应一个预测样本。通过 积分解为二维空间卷积和一维时间卷积,提出的
类别/地块分层,能够有效排除不同类别或地块之 TSST 网络模型如图 5 所示。整体上,网络包括
间的相互干扰,获取“纯净”的样本特征数据。 空 间 嵌 入 模 块(spatial embedding block, SEB)、
实验过程中也注意到,瓦片分层中的空白区 稠密空间连接模块(dense spatial block, DSB)、注
域(数据缺失)可能会导致模型训练过程不稳定、 意 力 模 块(channel-spatial attention, CSA)、向 量
模型训练不收敛甚至训练失败等问题。为此,尝 化模块(vector block, VB)和基于时域卷积网络
试采用随机填充和正态填充两种方法对空白区域 (temporal convolutional network,TCN)的分类模
进行模拟填充,以期改善模型训练过程。在随机 块等 5 个子模块。SEB 模块对输入时序影像进行
填充中,从有效像元中随机选取像元,并将其像元 空间包裹生成输入影像的高维特征表达;DSB 模
值填充到缺失位置;在正态填充中,假定有效像元 块用于提取影像的多层次空间信息;CSA 模块学
值服从正态分布,计算其均值与标准差,进而在均 习影像在空间和波段(属性)维度的注意力;VB
值的 3 倍标准差范围内随机生成像元值,并填充 模块将序列影像特征转化为多维时序信息;TCN
到缺失位置。此外,考虑到深度学习模型对数据 模块实现从多维时序特征到作物类别的映射,并
缺失具有一定的容忍性,实验中只有当影像瓦片 输出作物类别概率。
序列的平均缺失率大于 0.6 时,才会模拟填充空白 1) 多层次空间特征
区域,降低其数据缺失率至低于 0.6。 TSST 网络模型利用 DSB 模块提取影像的
2.4 TSST 网络模型 多尺度空间信息,其实现沿用了 DSNet [30] 中的稠
三维卷积神经网络能够学习影像序列的时 密膨胀卷积模块(图 5)。具体而言,DSB 利用具
空联合信息。本文为避免直接使用三维卷积的 有密集感受野的膨胀卷积来捕获影像空间的多
图 5 TSST 网络模型的整体架构
Fig. 5 Overall Architecture of TSST Network Model

