Page 95 - 《振动工程学报》2026年第5期

P. 95

第 5 期赵玲，等：大语言模型在跨座式单轨列车齿轮箱振动信号预测中的应用 1299

表 2 DGLC 数据集试验超参数设定表 4 模型预测步长为 96 时的消融试验结果
Tab. 2 Experimental hyperparameterization of the DGLC Tab. 4 Ablation experiment results when the model predicts
dataset with a step size of 96

相关参数相关参数值预测模型 MSE MAE RMSE
（DGLC_512_48, DGLC_512_96, F1 0.2036 0.3476 0.4513
模型 ID DGLC_512_192, DGLC_512_384, F2 0.2035 0.3483 0.4511
DGLC_512_768, DGLC_512_1536） F3 0.2032 0.3480 0.4508
F4 0.1919 0.3372 0.4381
预测步长 T （48, 96, 192, 384, 768, 1536）
F5 0.1744 0.3227 0.4176
批量大小 2
学习率从0.01衰退到0.001 从表 4 中可以看出，F5 模型在所有 3 个指标上
32
隐藏层维度 d model 均表现出色，在 MSE、MAE 和 RMSE 方面分别达到
128
前馈网络维度 d ff 了 0.1744、0.3227 和 0.4176，明显优于其他模型。F5
LLama 层数 32 模型的出色表现充分表明了 VSP-LLM 架构在跨座
训练 Epochs 30 式单轨列车齿轮箱振动信号预测任务中的有效性。
丢弃率 0.1
相比其他模型，F5 模型更好地捕捉到了振动信号中
激活函数 GELU
的复杂时序特性，显著提高了预测精度。
损失函数（MSE,RMSE,MAE）
试验结果表明，所提出的 VSP-LLM 架构能够在
学习率调整策略（COS, 无, 无, COS, 无, 无）
振动信号预测中提供准确的预测结果，不仅优化了

评价指标。评估预测模型性能依据 3 项指标：模型的学习能力，还降低了预测误差，提升了整体预
平均绝对误差（MAE）、均方根误差（RMSE）和均方测的可靠性。

误差（MSE），具体计算公式如下：
3.3 对比试验
1 n ∑
MAE = |y i − ˆy i | （8）
n 为了全面评估本文提出的模型的有效性，利用
i=1
v
t 试验室所采集的数据集进行对比试验。表
1 n ∑ DGLC 5
RMS E = (y i − ˆy i ) 2 （9）
n 系统地呈现了不同模型在各个预测步长下的性能表
i=1
现，包括平均绝对误差（MAE）、均方误差（MSE）和
1 n ∑
MS E = (y i − ˆy i ) 2 （10）
n 均方根误差（RMSE）3 项评估指标。为了全面了解模型
n=1
式中， n为预测长度；表示实际值；为预测值。在不同步长预测任务中的表现，重点对比了 Informer [18] 、
y i
ˆ y i
3 个评价指标的数值越低，代表模型预测性能越好。 Autoformer [24] 、 DLinear [25] 、 VSP-LLM 及其精调版本
VSP-LLM*模型 (VSP-LLM*模型是 VSP-LLM 的精调
3.2 消融试验结果分析版本，通过调整训练参数得到的模型) 的预测性能。
从表 5 中可以看到，在短时间步长预测任务（ T = 48
为了评估 VSP-LLM 架构中不同组件对预测性
和 T = 96）中，VSP-LLM*模型表现出色，步长 48 时的
能的影响，设定了消融试验模型，对模型进行了评
MAE 和 MSE 分别为 0.2517 和 0.1014，显著优于
估。具体包括表 3 中不同 prompt 模板的统计变量设
Autoformer（MAE: 0.7198, MSE: 0.8301），显示了其对
置，以及是否嵌入 DCBiformerNet 模块的试验评估。
短步长振动信号的高精度预测能力。在中等时间步
长预测任务（ T = 192和 T = 384）中， VSP-LLM*系列
表 3 消融试验模型类别
模型依旧保持优势，步长 192 时 VSP-LLM*的 MAE 为
Tab. 3 Ablation experiment model categories
为 0.1235，远低于
模型 prompt模板中的统计变量 DCBiformerNet模块 0.2793， MSE DLinear（ MAE: 0.4530,
MSE: 0.3461），展现了其在多步预测任务中的稳定性和
F1 5 ×
F2 9 × 鲁棒性。在超长步长预测任务（ T = 768和 T = 1536）
F3 5 √ 中，VSP-LLM*的表现继续优异，步长 768 时的 MAE
F4 7 √
为 0.2882， MSE 为 0.1317，明显领先于 Informer 和
F5 9 √
Autoformer，表明其在处理长时间序列信号时能够更
表 4 展示了不同预测模型在模型预测步长为 96 好地捕捉复杂特征，达到最佳预测效果。
时的消融试验结果。通过对比不同模型的性能指在不同试验设置下，VSP-LLM 模型性能的变化主
标，可以清晰地看到各个模型在 MSE、MAE 和 RMSE 要源于步长长度对预测复杂度的影响。在较短步长
这 3 项关键指标上的表现。（如 48、96）下，模型仅需捕捉较小范围的时间序列特

90 91 92 93 94 95 96 97 98 99 100