Page 91 - 《振动工程学报》2026年第5期
P. 91
第 5 期 赵 玲,等:大语言模型在跨座式单轨列车齿轮箱振动信号预测中的应用 1295
Feature FC Informer Decoder Linear
Concat
Informer Encoder
Basic Block
Multi-Head Multi-Head Cross-Attention
Position-wise Self-Attention ①continued to upward
LayerNorm
FFN Dilated Causal ②continued to
downward
Convolution FC ③first upward then
+ downward
Dropout
Linear
Linear
Linear
④first downward then
upward
Output
Dropout Basic Block Trend Prediction
+
Input
Multi-Head GRU GRU GRU
Self-Attention Distilling
LayerNorm
Dilated Causal Layer GRU GRU GRU
Convolution
Input
图 4 DCBiformerNet 模块架构展示
Fig. 4 Demonstration of DCBiformerNet module architecture
而提升对振动信号趋势变化的感知能力。 预 测 结 果 分 成 了“ continued to upward” “ continued to
基于 GRU 的 DCBiformerNet。为了进一步增强 downward”“first upward then downward”“first downward
模 型 对 时 序 依 赖 性 的 理 解, DCBiformerNet 集 成 了 then upward”4 类。通过这种全面的特征处理与预测
GRU 和交叉注意力机制 MHCA。GRU 具有在不丢 机制,DCBiformerNet 能够适应各种工况下的振动信
失重要历史信息的情况下,通过少量参数有效捕捉 号,提供高精度、高可靠性的预测结果。
序列中的长期依赖性的优点。结合交叉注意力机 DCBiformerNet 算法流程如图 5 所示。首先,对
制,模型能够在时间序列的前向和后向依赖性之间 输入特征进行位置编码;随后,通过多层稀疏因果卷
进行交互处理,从而进一步提高预测的精度,它们被 积(DCC)和多头自注意力(MHSA)模块交替提取局
集成到式 (3) 中。这种双向处理方式确保了模型能 部与全局特征;接着,GRU 被用来对时间序列信息
够识别并捕捉到振动信号中的复杂模式,无论这些 进行建模;最终,通过多头交叉注意力(MHCA)模块
模式是逐步发展的还是突变式的。 的融合处理,完成特征的聚合与输出。
最后,经过一系列复杂处理后的特征将通过全
连接层 FC(·)输出,生成最终的趋势预测结果。该输 2.2 VSP-LLM 架构
出层专门设计用于识别振动信号的各种可能趋势,将 进 一 步, 为 了 提 取 更 多 时 序 特 征 , 对 prompt 和
开始
X i,m =PE(X input ), n=1
否 否
n<N Q m �V m �K m n<N
是 是
X i,m =DCC(X i,m ), m=1 MHCA X t =X i,m
V m=GRU m(X t,h t−1)
否
n≥M X i,m =MHSA(X i,m ), b m
DCBiformer(x i ,x t )
n++
m++
是
n++ 结束
图 5 DCBiformerNet 模型算法流程图
Fig. 5 Flowchart of DCBiformerNet model algorithm

