Page 154 - 《振动工程学报》2026年第3期
P. 154

754                                振   动   工   程   学   报                               第 39 卷

                 (5)损失函数:损失函数的主要作用是衡量预测                         型 编 程 环 境 为 R7⁃5800H CPU,NVIDIA RTX3060
              值 与 实 际 值 之 间 的 差 异 。 交 叉 熵 损 失 函 数 又 称           GPU,Python3.8,Pytorch1.12,初 始 学 习 率 为 0.01,
              Softmax 损失函数,是神经网络在分类问题中常用                        采 用 SGD(stochastic gradient descent)作 为 优 化 算
              的目标函数。其主要目的是衡量预测分布与真实分                            法,其中 SGD 的动量为 0.9。学习速率衰减策略也
              布之间的差异。交叉熵损失函数表达式为:                               被用来调整学习速率,并且权重衰减值被初始化为
                                 1  G  C                        0.0005,损失函数为交叉熵。初始模型参数设置如
                                         ( k )
                          L =-     ∑∑   y j ln y ̂  ( k )  (9)
                                              j
                                G
                                   k = 1 j = 1                  表 1 所示。模型结构如图 3 所示,MDMAAN 模型
              式中, G 为样本数量; C 为类别数量; y j 为第 k 个样                 由公共特征提取器、特定特征提取器和两个故障诊
                                                ( k )
                                            ( k )
              本的第 j 个类别的真实标签值; y ̂          j 为第 k 个样本的         断单元组成,其中特征提取单元由卷积层、池化层、
              第 j 个类别的预测概率。                                     激活层、全连接层和多头注意力机制等组成,故障
                                                                诊断单元由多个 Softmax 分类器组成,总损失由源
              3. 2 模型参数及结构
                                                                域 分 类 损 失 、MK⁃MMD 损 失 和 分 类 器 分 类 损 失
                  基于 MDMAAN 的滚动轴承复合故障诊断模                        组成。

                                                表 1  MDMAAN 模型参数试验设置
                                       Tab. 1  Experimental settings of MDMAAN model parameters

                    参数名称               配置           参数名称             配置            参数名称              配置
                每次训练集样本点数              1000         激活层Ⅲ             ReLU          线性层Ⅰ              128
                每次测试集样本点数              250          池化层Ⅲ            MaxPool        激活层Ⅵ             ReLU
                    卷积层Ⅰ                4           卷积层Ⅳ              64           线性层Ⅱ               32
                 批量标准化层Ⅰ                4        批量标准化层Ⅳ              64           激活层Ⅶ             ReLU
                    激活层Ⅰ              ReLU          激活层Ⅳ             ReLU          线性层Ⅲ               1
                    池化层Ⅰ             MaxPool        池化层Ⅳ            MaxPool       全连接层Ⅱ               1
                    卷积层Ⅱ                16          卷积层Ⅴ              128         损失函数Ⅰ             交叉熵
                 批量标准化层Ⅱ                16        批量标准化层Ⅴ             128         损失函数Ⅱ            MK-MMD
                    激活层Ⅱ              ReLU          激活层Ⅴ             ReLU         损失函数Ⅲ             L1 损失
                    池化层Ⅱ             MaxPool        池化层Ⅴ        AdaptiveMaxPool   卷积核大小              7×7
                    卷积层Ⅲ                32         全连接层Ⅰ              512
                 批量标准化层Ⅲ                32        多头注意力层              512




















                                                   图 3  MDMAAN 模型结构图
                                             Fig. 3  Diagram of MDMAAN model structure

              3. 3 模型故障诊断流程                                          步骤 2:初始化模型,并将多个源域数据和目标
                                                                域 的 训 练 集 输 入 MDMAAN 模 型 中 ,进 行 模 型 的
                  基于多源域多头注意力自适应网络的滚动轴承
                                                                训练。
              故障诊断流程如图 4 所示。
                  步骤 1:将数据集按照不同工况划分成源域数                              步骤 3:通过公共特征提取器 F 对模型输入的
                            s
                      s
                                            t
              据 D 1, D 2,…, D n 和目标域数据 D ,并划分训练集、               数据进行特征提取,将提取到的原始特征映射到公
                  s
              测试集。                                              共特征空间。
   149   150   151   152   153   154   155   156   157   158   159