Page 102 - 《软件学报》2021年第8期
P. 102

2384                                   Journal of Software  软件学报 Vol.32, No.8,  August 2021

                 工作状态的准确分类.在实际工业背景下,优先发现故障比花费大量时间直接分类故障更具有实际意义.
                    考虑到轴承故障已知且种类较少,本文采用为不同故障选取伪特征的方式降低需要处理的数据量.针对故
                 障选出的伪特征组成的特征域涵盖大量该故障的相关信息,不易造成故障种类混淆,能够提高判断的准确度.使
                 用公式(14)~公式(16)筛选出对于不同故障状态下具有高分类准确率的伪特征:
                                         P r ( )C >  i  Threshold →  f  F =  r  [C r ,1 ,C r ,2 ,C r ,3 ,...,C r , r n  ]  (14)
                                         P o ( )C >  i  Threshold →  f  F =  o  [C o ,1 ,C o ,2 ,C o ,3 ,...,C o , o n  ]  (15)
                                         P b ( )C >  i  Threshold →  f  F =  b  [C b ,1 ,C b ,2 ,C b ,3 ,...,C b , b n  ]  (16)
                 其中,P r (C i )是第 i 个伪特征对于判断内圈故障的准确度,类似地,P o (C i )和 P b (C i )分别表示第 i 个伪特征对于判断
                 外圈故障和滚珠故障的准确度,Threshold f 是人为设置的阈值,F r ,F o 和 F b 是分别针对内圈故障、外圈故障、滚
                 珠故障所选择的伪特征组成的特征域.为故障筛选伪特征是为了筛选出包含特定故障种类相关信息最多的伪
                 特征,而非直接用于分类故障.并行式 1D-CNN 筛选伪特征构造的健康状态判别模型具有低时延、低复杂度、
                 强泛化能力的特点,而为故障分类筛选出的伪特征所包含的信息比全局学习得到的特征更具针对性,也意味着
                 多个故障信息重叠易造成混淆判断的区域会被舍弃.

                 2.3   基于联合特征提取的故障诊断
                    对实时收集的振动信号优先采集健康状态特征域,并在训练完成的健康状态判别模型中对其进行判别,确
                 定轴承的健康状态,对表现出非健康状态的数据重新采样,使用耦合自动编码器的 softmax 层对其进行分类,得
                 出确切的故障类型.
                    由于当前筛选出的针对 3 种故障的 3 个特征域本质上是轴承旋转一周所得采样点中富含特定工况信息的
                 段落集合,虽然包含大量特定工况的信息,但是缺少关联性和完整性.如果效仿健康状态判别模型将特征域内的
                 元素连接成一维数组形成新的子样本并通过 1D-CNN 学习,则无法达到良好的故障分类效果.综合考虑裁剪周
                 期后数据不完整、缺少相关性的特点,将筛选出来的伪特征组与原始信号通过自动编码器做联合特征处理后对
                 具体故障进行识别.
                    首先对原始信号采样数据的矩阵进行全局归一化,数学表达式如下:
                                                      ˆ p =  p j  /|| p j  || 2                      (17)
                                                       j
                                                               ()i
                    p 是以周期为行、以样本数为列的原始信号数据集, p 表示矩阵中第 i 行、第 j 列的数据点,||p j || 2 表示第 j
                                                               j
                 列的二范数.上述公式表示每一列的每一个数据点除以该列的二范数.
                    随后归一化每个样本的特征:
                                                     p   ()i  =  ˆ p ()i  /||  ˆ p ( )i  || 2        (18)
                      (i)
                    ||p || 2 是每一行的二范数.上述公式表示每一行的每个数据点除以该行的二范数.
                    耦合自动编码器期望得到一种稀疏且特征间依然具有相关性的原始信号数据集,用来弥补被挑选出来的
                 伪特征间缺失的相关性和裁剪掉的信息所包含的相关信息.因此,本文采用两个自动编码器进行两组数据间的
                 特征耦合,即:将两个数据集通过编码器和解码器进行重构,通过重构误差和相关性度量组成的损失函数实现高
                 准确度的故障分类.自动编码器的编码解码如下:
                                                   h i =f s (C i ) and z i =g s (h i )               (19)
                 其中,f s 为特征提取函数,即编码器;h i 是 C i 编码的表示;g s 函数映射回输入空间;s 是编码器与解码器的权重和偏
                 置的集合{W,b,W′,d}.
                    自动编码器在训练过程中减小重构误差:
                                                  S = argmin ∑  j  L ( , )C z                        (20)
                                                             i= 1  i  i
                    L(⋅)表示重构函数.
                    通常情况下,使用平方误差表示重构误差,训练则使用反向传播,通过梯度下降实现最小化.
                    F r ,F o 和 F b 分别与 p 进行重构耦合,以外圈故障为例,为重构误差增加相关性度量项,相关性度量定义如下:
   97   98   99   100   101   102   103   104   105   106   107