Page 91 - 《振动工程学报》2026年第5期
P. 91

第 5 期              赵 玲,等:大语言模型在跨座式单轨列车齿轮箱振动信号预测中的应用                                        1295


                                   Feature FC              Informer Decoder  Linear
                                                                   Concat
                      Informer Encoder
                       Basic Block
                                              Multi-Head       Multi-Head Cross-Attention
                                    Position-wise  Self-Attention                                  ①continued to upward
                          LayerNorm
                                      FFN    Dilated Causal                                        ②continued to
                                                                                                   downward
                                              Convolution                             FC           ③first upward then
                           +                                                                       downward
                                     Dropout
                                                                          Linear
                                                                   Linear
                                                            Linear
                                                                                                   ④first downward then
                                                                                                   upward
                                                                                                      Output
                          Dropout             Basic Block                                           Trend Prediction
                                      +
                 Input
                          Multi-Head                       GRU    GRU    GRU
                         Self-Attention       Distilling
                                    LayerNorm
                         Dilated Causal        Layer          GRU    GRU    GRU
                          Convolution
                                                                   Input

                                                 图 4 DCBiformerNet 模块架构展示
                                        Fig. 4 Demonstration of DCBiformerNet module architecture
              而提升对振动信号趋势变化的感知能力。                                预 测 结 果 分 成 了“ continued to upward” “ continued to
                  基于   GRU  的  DCBiformerNet。为了进一步增强            downward”“first upward then downward”“first downward
              模 型 对 时 序 依 赖 性 的 理 解, DCBiformerNet 集 成 了        then upward”4  类。通过这种全面的特征处理与预测
              GRU  和交叉注意力机制          MHCA。GRU    具有在不丢          机制,DCBiformerNet 能够适应各种工况下的振动信
              失重要历史信息的情况下,通过少量参数有效捕捉                            号,提供高精度、高可靠性的预测结果。
              序列中的长期依赖性的优点。结合交叉注意力机                                 DCBiformerNet 算法流程如图       5  所示。首先,对
              制,模型能够在时间序列的前向和后向依赖性之间                            输入特征进行位置编码;随后,通过多层稀疏因果卷
              进行交互处理,从而进一步提高预测的精度,它们被                           积(DCC)和多头自注意力(MHSA)模块交替提取局
              集成到式     (3) 中。这种双向处理方式确保了模型能                     部与全局特征;接着,GRU            被用来对时间序列信息
              够识别并捕捉到振动信号中的复杂模式,无论这些                            进行建模;最终,通过多头交叉注意力(MHCA)模块
              模式是逐步发展的还是突变式的。                                   的融合处理,完成特征的聚合与输出。
                  最后,经过一系列复杂处理后的特征将通过全
              连接层   FC(·)输出,生成最终的趋势预测结果。该输                      2.2    VSP-LLM 架构
              出层专门设计用于识别振动信号的各种可能趋势,将                               进 一 步, 为 了 提 取 更 多 时 序 特 征 , 对    prompt 和

                                      开始




                                 X i,m =PE(X input ), n=1



                                                      否                      否
                                      n<N                         Q m �V m �K m     n<N
                                        是                                             是

                                 X i,m =DCC(X i,m ), m=1            MHCA           X t =X i,m


                                                                                V m=GRU m(X t,h t−1)
                                            否
                                      n≥M       X i,m =MHSA(X i,m ), b m
                                                                 DCBiformer(x i ,x t )
                                                                                    n++
                                                     m++
                                        是

                                      n++                            结束

                                                图 5 DCBiformerNet 模型算法流程图
                                           Fig. 5 Flowchart of DCBiformerNet model algorithm
   86   87   88   89   90   91   92   93   94   95   96