Page 89 - 《振动工程学报》2026年第5期
P. 89
第 5 期 赵 玲,等:大语言模型在跨座式单轨列车齿轮箱振动信号预测中的应用 1293
原始时间序列 你能帮我一下吗?
振动信号幅值/(m·s −1 ) 层归一化 预测结果:当然,你
需要什么帮助?
时间步长/ms 输出层
振动信号幅值/(m·s −1 ) 前馈
时间步长/ms 大预言模型
级 离散时间序列 层归一化
等
别
类 嵌入层
的
后
化
散 注意力模块
离
时间步长/ms 标准差 你能帮我一
振动信号幅值/(m·s −1 ) 最小值 你能帮我一下吗? 下吗?
均值
最大值
文本编码
窗口编号
图 2 大语言模型在序列数据预测中的应用示意图
Fig. 2 Schematic of the application of LLM in sequence data prediction
图 2 右图展示了大语言模型如何处理和预测文 步骤 3:进行跨座式单轨列车齿轮箱振动信号预
本数据,包括输入文本的编码、通过注意力机制处 测任务。
理以及通过多层网络结构最终输出预测结果的过 在步骤 3 中,为了更有效地提取时序特征,本文
程。这种模型处理文本数据的方式与处理振动信号 对提示(prompt)和输入(input)进行了设计,将单轨列
数据非常相似。 车齿轮箱振动信号的特征与趋势嵌入 prompt 中,以
将振动信号数据视为一种“语言”,其中的每个 解决预测波动性不足、振动信号趋势误差较大以及
信号片段都相当于语言中的一个“词汇”。在这种观 预 测 值 滞 后 于 实 际 值 等 问 题 。 最 终, 提 出 了 VSP-
点下,振动信号的预测就类似于语言模型中的单词 LLM 架构,用于实现跨座式单轨列车齿轮箱振动信
预测。因此,可以使用类似的模型架构来编码振动 号的精准预测。
信号,捕捉信号时间序列中的模式和依赖关系,然后
2.1 DCBiformerNet 模型架构
通过模型来预测未来的信号状态。
为了准确预测跨座式单轨列车齿轮箱的振动信
2 使 用 大 语 言 模 型 预 测 振 动 信 号 号趋势,本文提出了 DCBiformerNet,即基于 Informer [17]
模型的改进版本,其结构如图 4 所示。DCBiformerNet
图 3 展示了整个预测跨座式单轨列车齿轮箱振 模 型 主 要由 input、 informer encoder、 Informer decoder
动信号的工作流程,共包含 3 个步骤。 和 output 四个部分组成。文章中将 DCBiformerNet 预
步骤 1: 利 用 DCBiformerNet( deformable convolu- 测趋势的任务看作分类任务,则嵌入因果卷积、门
tional bi-directional gated recurrent unit network based on 控循环单元(GRU)、多头自注意力(MHSA)以及多
informer)进行齿轮箱振动信号的趋势预测。 头交叉注意力(MHCA) [13] 模块被应用为:
在步骤 1 中,原始的振动信号数据经过输入预 ( pos )
PE(pos,2i) = sin
10000 2i/d model (1)
处 理 后, 送 入 DCBiformerNet 模 型 。 该 模 型 将 GRU X i,m ( pos )
PE(pos,2i+1) = cos
和 Wavenet 中的因果卷积嵌入 Informer 基础架构中, 10000 2i/d model
用以提取齿轮箱振动信号的时序特征,最终输出趋 N ∑
⇒Q m ,K m ,V m = W n ·
势数据。该步骤的目标是获取跨座式单轨列车齿轮 n=1
M
箱振动信号的有效趋势。 ∑ ( ( ))
W n,m ·MHSA DCC X i,m +b m (2)
步骤 2:设计通用提示词和任务特定提示词。 m=1
步骤 2 着重于构建有效的提示词模板。首先从 ( ) N ∑
⇒DCBiformer X i,m , x t = W n ·
历史数据中提取特定领域的信息,包括预测要求和 n=1
M
统计数据,如最小值和中值等。这些信息经过处理, ∑
W n,m ·MHCA(Q m ,K m ,GRU m (x t ,h t−1 ))+b m
形成了通用提示词和特定任务提示词模板,为模型 m=1
预测提供了清晰的指令框架。 (3)

