Page 54 - 《爆炸与冲击》2026年第5期

P. 54

第 46 卷苏浩，等：单晶金属中微孔洞生长过程的深度学习预测方法第 5 期

型在三个空间方向上的坐标网格矩阵。模型输出为预测得到的下一时刻的物理信息。
深度神经网络模型由四个部分组成：下采样网络和上采样网络组成的 U-Net 模型、生成模型、Query
网络模型和回归预测网络模型。U-Net 模型中的下采样网络从输入的物理信息和位置信息中分别提取
物理图像特征和位置图像特征。将位置图像特征和物理图像特征进行展平后，利用位置图像特征对物
理图像特征进行位置信息嵌入。位置信息嵌入后的物理图像特征作为生成模型中 Transformer 的编码器
组件的输入。生成模型中 Transformer 解码器组件的状态查询序列由 Query 网络模型得到。Transformer
生成的预测物理图像特征序列进行反展平后，通过 U-Net 模型中的上采样网络进行图像特征解码，并最
终通过回归预测网络模型得到深度学习网络模型的输出。接下来对深度神经网络模型的各部分进行详
细阐述。
深度神经网络模型的第一部分为 U-Net 模型，其结构示意图如图 5 所示。其中，下采样网络由三个
卷积模块相连接组成，主要任务是对深度神经网络模型输入中的物理信息和位置信息进行图像特征提
取。上采样网络由两个三线性插值模块和一个反卷积模块相连接组成，主要任务是将生成模型生成的
预测物理图像特征进行解码，以获取与输入的物理信息具有相同空间结构的物理图像特征。

Downsampling network Upsampling network
Conv 1 Deconv 1
Conv 2 Tri interpolation 2
Conv 3 Tri interpolation 1 Regression
Generative
Input prediction
module network

Latent space
superposition

图 5 深度神经网络模型中 U-Net 模型示意图
Fig. 5 The U-Net model in the deep neural network
为了降低 U-Net 模型在下采样-上采样过程中的信息损失，模型中将下采样网络中卷积模块 1 和卷
积模块 2 输出的物理信息的特征图分别与上采样网络中的两个三线性插值模块相连接，称为潜空间叠
加。潜空间叠加使得上采样网络的解码过程保留了输入时刻物理信息下采样过程的图像特征信息，上
采样网络的任务变为，将生成模型的特征序列解码为图像特征的残差，从而显著降低了解码难度，使网
络更容易训练。值得注意的是，三线性插值模块中三线性插值层输出特征图的预设空间尺寸需要与下
采样网络中两个卷积模块的输出图像特征的空间尺寸必须保持一致，以完成潜空间叠加操作。
深度神经网络模型中生成模型的主要结构为一个 Transformer 模型，其主要功能为，根据下采样网络
提取的时刻 t 的物理图像特征和位置图像特征预测时刻 t+Δt 的物理图像特征。Transformer 模型中编码
器组件包含 6 个完全相同的编码器，解码器组件中包含 6 个完全相同的解码器，其中解码器组件中的输
入由 Query 网络模型生成。

Query 网络模型的主要功能是，对深度神经网络模型的输入中的物理信息和位置信息进行图像特征
提取，并生成 Transformer 模型解码器组件的输入。本文中 Query 网络模型的主要结构为一个三维卷积
神经网络，其网络结构和参数数目与 U-Net 模型中下采样网络完全一致，但 Query 网络模型中的参数是
独立训练的。
回归预测网络模型的主要功能为，根据 U-Net 模型中上采样网络解码得到的物理图像特征，对输出
物理信息进行预测。回归预测网络模型的网络结构如图 6 所示。该网络模型通过三个独立的三维卷积
神经网络，对孔洞区域划分、局部位错密度和平均 von Mises 等效应力进行预测。需要注意的是，由于预
测的各物理量是通过不同的卷积神经网络独立预测得到的，因此并不自动满足物理量之间的关联，需要

051423-6

49 50 51 52 53 54 55 56 57 58 59