Page 95 - 《振动工程学报》2026年第5期
P. 95
第 5 期 赵 玲,等:大语言模型在跨座式单轨列车齿轮箱振动信号预测中的应用 1299
表 2 DGLC 数据集试验超参数设定 表 4 模型预测步长为 96 时的消融试验结果
Tab. 2 Experimental hyperparameterization of the DGLC Tab. 4 Ablation experiment results when the model predicts
dataset with a step size of 96
相关参数 相关参数值 预测模型 MSE MAE RMSE
(DGLC_512_48, DGLC_512_96, F1 0.2036 0.3476 0.4513
模型 ID DGLC_512_192, DGLC_512_384, F2 0.2035 0.3483 0.4511
DGLC_512_768, DGLC_512_1536) F3 0.2032 0.3480 0.4508
F4 0.1919 0.3372 0.4381
预测步长 T (48, 96, 192, 384, 768, 1536)
F5 0.1744 0.3227 0.4176
批量大小 2
学习率 从0.01衰退到0.001 从表 4 中可以看出,F5 模型在所有 3 个指标上
32
隐藏层维度 d model 均表现出色,在 MSE、MAE 和 RMSE 方面分别达到
128
前馈网络维度 d ff 了 0.1744、0.3227 和 0.4176,明显优于其他模型。F5
LLama 层数 32 模型的出色表现充分表明了 VSP-LLM 架构在跨座
训练 Epochs 30 式单轨列车齿轮箱振动信号预测任务中的有效性。
丢弃率 0.1
相比其他模型,F5 模型更好地捕捉到了振动信号中
激活函数 GELU
的复杂时序特性,显著提高了预测精度。
损失函数 (MSE,RMSE,MAE)
试验结果表明,所提出的 VSP-LLM 架构能够在
学习率调整策略 (COS, 无, 无, COS, 无, 无)
振动信号预测中提供准确的预测结果,不仅优化了
评价指标。评估预测模型性能依据 3 项指标: 模型的学习能力,还降低了预测误差,提升了整体预
平均绝对误差(MAE)、均方根误差(RMSE)和均方 测的可靠性。
误差(MSE),具体计算公式如下:
3.3 对比试验
1 n ∑
MAE = |y i − ˆy i | (8)
n 为了全面评估本文提出的模型的有效性,利用
i=1
v
t 试验室所采集的 数据集进行对比试验。表
1 n ∑ DGLC 5
RMS E = (y i − ˆy i ) 2 (9)
n 系统地呈现了不同模型在各个预测步长下的性能表
i=1
现,包括平均绝对误差(MAE)、均方误差(MSE)和
1 n ∑
MS E = (y i − ˆy i ) 2 (10)
n 均方根误差(RMSE)3 项评估指标。为了全面了解模型
n=1
式 中, n为 预 测 长 度 ; 表 示 实 际 值 ; 为 预 测 值 。 在不同步长预测任务中的表现,重点对比了 Informer [18] 、
y i
ˆ y i
3 个评价指标的数值越低,代表模型预测性能越好。 Autoformer [24] 、 DLinear [25] 、 VSP-LLM 及 其 精 调 版 本
VSP-LLM*模型 (VSP-LLM*模型是 VSP-LLM 的精调
3.2 消融试验结果分析 版本,通过调整训练参数得到的模型) 的预测性能。
从表 5 中可以看到,在短时间步长预测任务( T = 48
为了评估 VSP-LLM 架构中不同组件对预测性
和 T = 96)中,VSP-LLM*模型表现出色,步长 48 时的
能的影响,设定了消融试验模型,对模型进行了评
MAE 和 MSE 分 别 为 0.2517 和 0.1014, 显 著 优 于
估。具体包括表 3 中不同 prompt 模板的统计变量设
Autoformer(MAE: 0.7198, MSE: 0.8301),显示了其对
置,以及是否嵌入 DCBiformerNet 模块的试验评估。
短步长振动信号的高精度预测能力。在中等时间步
长 预 测 任 务( T = 192和 T = 384) 中 , VSP-LLM*系 列
表 3 消融试验模型类别
模型依旧保持优势,步长 192 时 VSP-LLM*的 MAE 为
Tab. 3 Ablation experiment model categories
为 0.1235, 远 低 于
模型 prompt模板中的统计变量 DCBiformerNet模块 0.2793, MSE DLinear( MAE: 0.4530,
MSE: 0.3461),展现了其在多步预测任务中的稳定性和
F1 5 ×
F2 9 × 鲁棒性。在超长步长预测任务( T = 768和 T = 1536)
F3 5 √ 中,VSP-LLM*的表现继续优异,步长 768 时的 MAE
F4 7 √
为 0.2882, MSE 为 0.1317, 明 显 领 先 于 Informer 和
F5 9 √
Autoformer,表明其在处理长时间序列信号时能够更
表 4 展示了不同预测模型在模型预测步长为 96 好地捕捉复杂特征,达到最佳预测效果。
时的消融试验结果。通过对比不同模型的性能指 在不同试验设置下,VSP-LLM 模型性能的变化主
标,可以清晰地看到各个模型在 MSE、MAE 和 RMSE 要源于步长长度对预测复杂度的影响。在较短步长
这 3 项关键指标上的表现。 (如 48、96)下,模型仅需捕捉较小范围的时间序列特

