Page 89 - 《振动工程学报》2026年第5期
P. 89

第 5 期              赵 玲,等:大语言模型在跨座式单轨列车齿轮箱振动信号预测中的应用                                        1293

                                                    原始时间序列                                        你能帮我一下吗?
                  振动信号幅值/(m·s −1 )                              层归一化                             预测结果:当然,你
                                                                                                   需要什么帮助?

                                   时间步长/ms                                              输出层
                  振动信号幅值/(m·s −1 )                               前馈



                                   时间步长/ms                                            大预言模型
                  级                                离散时间序列       层归一化
                  等
                  别
                  类                                                                     嵌入层
                  的
                  后
                  化
                  散                                            注意力模块
                  离
                                   时间步长/ms             标准差                                         你能帮我一
                  振动信号幅值/(m·s −1 )                     最小值   你能帮我一下吗?                               下吗?
                                                       均值
                                                       最大值
                                                                文本编码
                                    窗口编号

                                           图 2 大语言模型在序列数据预测中的应用示意图
                                    Fig. 2 Schematic of the application of LLM in sequence data prediction
                  图  2  右图展示了大语言模型如何处理和预测文                          步骤   3:进行跨座式单轨列车齿轮箱振动信号预
              本数据,包括输入文本的编码、通过注意力机制处                            测任务。
              理以及通过多层网络结构最终输出预测结果的过                                 在步骤    3  中,为了更有效地提取时序特征,本文
              程。这种模型处理文本数据的方式与处理振动信号                            对提示(prompt)和输入(input)进行了设计,将单轨列
              数据非常相似。                                           车齿轮箱振动信号的特征与趋势嵌入                   prompt 中,以
                  将振动信号数据视为一种“语言”,其中的每个                         解决预测波动性不足、振动信号趋势误差较大以及
              信号片段都相当于语言中的一个“词汇”。在这种观                           预 测 值 滞 后 于 实 际 值 等 问 题 。 最 终, 提 出 了      VSP-
              点下,振动信号的预测就类似于语言模型中的单词                            LLM  架构,用于实现跨座式单轨列车齿轮箱振动信
              预测。因此,可以使用类似的模型架构来编码振动                            号的精准预测。

              信号,捕捉信号时间序列中的模式和依赖关系,然后
                                                                2.1    DCBiformerNet 模型架构
              通过模型来预测未来的信号状态。

                                                                    为了准确预测跨座式单轨列车齿轮箱的振动信
              2    使  用  大  语  言  模  型  预  测  振  动  信  号        号趋势,本文提出了         DCBiformerNet,即基于   Informer [17]
                                                                模型的改进版本,其结构如图             4  所示。DCBiformerNet
                  图  3  展示了整个预测跨座式单轨列车齿轮箱振                      模 型 主 要由    input、 informer encoder、 Informer decoder
              动信号的工作流程,共包含            3  个步骤。                   和  output 四个部分组成。文章中将          DCBiformerNet 预
                  步骤   1: 利 用  DCBiformerNet( deformable convolu-  测趋势的任务看作分类任务,则嵌入因果卷积、门

              tional bi-directional gated recurrent unit network based on  控循环单元(GRU)、多头自注意力(MHSA)以及多
              informer)进行齿轮箱振动信号的趋势预测。                          头交叉注意力(MHCA)         [13]  模块被应用为:
                  在步骤    1  中,原始的振动信号数据经过输入预                                         (    pos   )
                                                                        PE(pos,2i) = sin
                                                                       
                                                                       
                                                                       
                                                                                      10000 2i/d model   (1)
              处 理 后, 送 入   DCBiformerNet 模 型 。 该 模 型 将  GRU         X i,m               (    pos   )
                                                                       
                                                                        PE(pos,2i+1) = cos
                                                                       
                                                                       
              和  Wavenet 中的因果卷积嵌入        Informer 基础架构中,                                  10000 2i/d model
              用以提取齿轮箱振动信号的时序特征,最终输出趋                                               N ∑
                                                                      ⇒Q m ,K m ,V m =  W n ·
              势数据。该步骤的目标是获取跨座式单轨列车齿轮                                              n=1
                                                                          M                       
              箱振动信号的有效趋势。                                               ∑            (    (  ))    
                                                                        
                                                                           W n,m ·MHSA DCC X i,m +b m    (2)
                                                                                                 
                  步骤  2:设计通用提示词和任务特定提示词。                                 m=1
                  步骤  2  着重于构建有效的提示词模板。首先从                                     (     )  N ∑
                                                                   ⇒DCBiformer X i,m , x t =  W n ·
              历史数据中提取特定领域的信息,包括预测要求和                                                    n=1
                                                                       M                                  
              统计数据,如最小值和中值等。这些信息经过处理,                                ∑                                    
                                                                                                          
                                                                                                          
                                                                        W n,m ·MHCA(Q m ,K m ,GRU m (x t ,h t−1 ))+b m
              形成了通用提示词和特定任务提示词模板,为模型                                   m=1                                
              预测提供了清晰的指令框架。                                                                               (3)
   84   85   86   87   88   89   90   91   92   93   94