Page 95 - 《振动工程学报》2026年第5期
P. 95

第 5 期              赵 玲,等:大语言模型在跨座式单轨列车齿轮箱振动信号预测中的应用                                        1299


                       表 2 DGLC  数据集试验超参数设定                           表 4 模型预测步长为       96 时的消融试验结果
              Tab. 2 Experimental  hyperparameterization  of  the  DGLC  Tab. 4 Ablation  experiment  results  when  the  model  predicts
                    dataset                                            with a step size of 96

                 相关参数                  相关参数值                       预测模型          MSE        MAE        RMSE
                                (DGLC_512_48, DGLC_512_96,            F1         0.2036     0.3476     0.4513
                 模型 ID         DGLC_512_192, DGLC_512_384,            F2         0.2035     0.3483     0.4511
                               DGLC_512_768, DGLC_512_1536)           F3         0.2032     0.3480     0.4508
                                                                      F4         0.1919     0.3372     0.4381
                预测步长   T         (48, 96, 192, 384, 768, 1536)
                                                                      F5         0.1744     0.3227     0.4176
                 批量大小                      2
                 学习率                从0.01衰退到0.001                   从表   4  中可以看出,F5 模型在所有          3  个指标上
                                          32
              隐藏层维度 d model                                     均表现出色,在 MSE、MAE 和 RMSE 方面分别达到
                                          128
              前馈网络维度 d ff                                       了 0.1744、0.3227 和 0.4176,明显优于其他模型。F5
                LLama 层数                  32                    模型的出色表现充分表明了               VSP-LLM  架构在跨座
                训练 Epochs                 30                    式单轨列车齿轮箱振动信号预测任务中的有效性。
                 丢弃率                      0.1
                                                                相比其他模型,F5 模型更好地捕捉到了振动信号中
                 激活函数                    GELU
                                                                的复杂时序特性,显著提高了预测精度。
                 损失函数               (MSE,RMSE,MAE)
                                                                    试验结果表明,所提出的            VSP-LLM  架构能够在
              学习率调整策略             (COS, 无, 无, COS, 无, 无)
                                                                振动信号预测中提供准确的预测结果,不仅优化了

                  评价指标。评估预测模型性能依据                   3  项指标:     模型的学习能力,还降低了预测误差,提升了整体预
              平均绝对误差(MAE)、均方根误差(RMSE)和均方                        测的可靠性。

              误差(MSE),具体计算公式如下:
                                                                3.3    对比试验
                                    1  n ∑
                             MAE =      |y i − ˆy i |  (8)
                                    n                               为了全面评估本文提出的模型的有效性,利用
                                      i=1
                                   v
                                   t                            试验室所采集的              数据集进行对比试验。表
                                     1  n ∑                                     DGLC                         5
                           RMS E =       (y i − ˆy i ) 2  (9)
                                     n                          系统地呈现了不同模型在各个预测步长下的性能表
                                       i=1
                                                                现,包括平均绝对误差(MAE)、均方误差(MSE)和
                                   1  n ∑
                             MS E =     (y i − ˆy i ) 2  (10)
                                   n                            均方根误差(RMSE)3       项评估指标。为了全面了解模型
                                     n=1
              式 中,  n为 预 测 长 度 ; 表 示 实 际 值 ; 为 预 测 值 。          在不同步长预测任务中的表现,重点对比了                  Informer [18] 、
                                                y i
                                  ˆ y i
              3     个评价指标的数值越低,代表模型预测性能越好。                      Autoformer [24] 、 DLinear [25] 、 VSP-LLM  及 其 精 调 版 本
                                                                VSP-LLM*模型    (VSP-LLM*模型是     VSP-LLM  的精调
              3.2    消融试验结果分析                                   版本,通过调整训练参数得到的模型) 的预测性能。
                                                                    从表  5  中可以看到,在短时间步长预测任务(             T = 48
                  为了评估     VSP-LLM  架构中不同组件对预测性
                                                                和 T = 96)中,VSP-LLM*模型表现出色,步长            48  时的
              能的影响,设定了消融试验模型,对模型进行了评
                                                                MAE  和  MSE  分 别 为   0.2517  和  0.1014, 显 著 优 于
              估。具体包括表        3  中不同  prompt 模板的统计变量设
                                                                Autoformer(MAE: 0.7198, MSE: 0.8301),显示了其对
              置,以及是否嵌入        DCBiformerNet 模块的试验评估。
                                                                短步长振动信号的高精度预测能力。在中等时间步
                                                                长 预 测 任 务(   T = 192和  T = 384) 中 , VSP-LLM*系 列
                            表 3 消融试验模型类别
                                                                模型依旧保持优势,步长           192  时  VSP-LLM*的  MAE  为
                     Tab. 3 Ablation experiment model categories
                                                                           为  0.1235, 远 低 于
                模型     prompt模板中的统计变量       DCBiformerNet模块     0.2793, MSE                DLinear( MAE: 0.4530,
                                                                MSE: 0.3461),展现了其在多步预测任务中的稳定性和
                 F1            5                   ×
                 F2            9                   ×            鲁棒性。在超长步长预测任务(                T = 768和 T = 1536)
                 F3            5                   √            中,VSP-LLM*的表现继续优异,步长              768  时的  MAE
                 F4            7                   √
                                                                为  0.2882, MSE  为  0.1317, 明 显 领 先 于  Informer 和
                 F5            9                   √
                                                                Autoformer,表明其在处理长时间序列信号时能够更
                  表  4  展示了不同预测模型在模型预测步长为 96                    好地捕捉复杂特征,达到最佳预测效果。
              时的消融试验结果。通过对比不同模型的性能指                                 在不同试验设置下,VSP-LLM          模型性能的变化主
              标,可以清晰地看到各个模型在 MSE、MAE                 和 RMSE     要源于步长长度对预测复杂度的影响。在较短步长
              这  3  项关键指标上的表现。                                  (如  48、96)下,模型仅需捕捉较小范围的时间序列特
   90   91   92   93   94   95   96   97   98   99   100