Page 86 - 《振动工程学报》2025年第11期
P. 86

2544                               振     动     工     程     学     报                     第 38 卷

              提取滚动轴承早期故障特征。文献                  [3-4] 则围绕旋       知识图谱与维保文档的构建,普遍以维修语料、工
              转机械中的重复瞬态分量构建了基于基尼指数等稀                            单文本等为输入,借助 LLM 做实体关系抽取与文档
              疏测度的系列算法。YAN           等  [5]  系统回顾了小波变换          生成,面向机器人等装备进行运维;二是将                     LLM  作
              的多分辨率分析优势,指出其在旋转机械故障诊断                            为端到端的“黑箱”分类器,例如               FD-LLM 将频谱或
              中的持续创新潜力。针对旋转机械振动分析,形成                            统计特征序列转成可被 LLM 读入的文本/表格式表
              了预处理、时频变换、特征提取、模式识别的经典流                           示,再进行分类       [14] ,这继承了深度学习模型可解释性
              程。该流程通过一系列具有明确物理意义的“算子                            不足、泛化能力有限的特点             [15] 。
              (operator)”组合,将原始振动信号转化为可供决策的                         LLM  凭借大规模训练具备强理解、生成与推理
              特征。表     1  总结了主要阶段、典型算子及其目的。                     能力,随规模与上下文的扩展,涌现出长期记忆、链
                                                                式推理与工具使用的能力,具备充当主动决策核心
                      表 1 振动信号处理典型算子及其目的                        的潜力。ALUR      等  [16]  指出开发准确、性能优良,且安
              Tab. 1 Typical operators in vibration signal processing and its  全和可信的  AI 决策系统,可以结合神经网络和符号
                    purposes                                    推理的优势,以提高          AI 系统的可解释性和可验证

                阶段       典型算子                主要目的               性,开发可靠、可预测且符合伦理标准的可信                      AI 智
                                           提升信噪比,
               预处理     滤波、归一化等                                  能体(trustworthy AI agents)。微软的    HuggingGPT 验
                                          去除无关干扰等
                                                                证了   LLM 作为智能体驱动任务规划与工具调用的
                时/频   傅里叶变换、小波 将时域信号转换到频域或时频域,
                变换        变换等       揭示周期冲击等故障特征频率等              可行性   [17] 。HUANG  等  [18]  则进一步验证了   LLM 通过
                     均方根、稀疏测度、                                  “自我验证”策略已达到国际数学奥赛金牌水平。
              特征提取                      量化并用于模式识别等
                       复杂性测度等                                       尽管单个     LLM 智能体能力强大,但在应对如信

                                                                号处理般复杂的、多阶段的工程任务时,往往会受
                  尽管这套由专家手工编排的分析方法经过了长
                                                                到  LLM  上下文长度的限制而导致规划僵化或决策
              期实践检验,具备良好的可解释性,但其开发与维护
                                                                遗漏。而多智能体系统(multi-agent system, MAS)
              过程高度依赖专家经验。研究者需要针对特定设备
                                                                可以让多个智能体通过协作或竞争共同完成任务,
              与工况,人工选择滤波器、变换域及统计量并反复
                                                                通过维护自身的上下文,智能体可以利用自然语言
              调参。这种为特定场景设计的“特解”不仅费时费
                                                                或结构化的消息进行对话,从而动态地生成、评估
              力,其固定的决策链也难以适应多变的工况、新型
                                                                和修订计划,极大地降低了系统耦合度,提升了整体
              故障模式或大规模非平稳数据,导致诊断性能显著
                                                                方案的鲁棒性与全局性。
              下降。为突破“人工设计”的瓶颈,以深度学习为代
                                                                    如图   1  所示, 一个典型的多智能体          [19]  工作流可
              表的神经主义范式为端到端特征学习带来了革命。
                                                                被抽象为“感知-思考-行动”的循环:通过将环境状
              然而,这类数据驱动的深度模型将诊断过程封装为
                                                                态、任务目标和可用工具等信息编码为自然语言提
              “黑箱”,导致模型可复现性不足,泛化到分布外数
                                                                示,LLM   能够自主进行任务分解、步骤规划,并最终
                          [6]
              据的能力有限 ,且其决策过程难以与物理先验知识
                                                                输出文本决策。相比于规则固化的传统专家系统,
              显式融合    [7-8] 。因此,在要求高安全与高可靠性的工

              业场景中,可解释性与可信度不足仍是深度模型落
                                                                                        用户请求
              地的主要障碍。“可解释但固化”的传统方法与“自
              适应但黑箱”的深度模型之间的核心困境,凸显了构
                                                                           提供上下文
              建新一代智能诊断系统的迫切需求。                                                         规划与决策
                                                                         储存
                  近 年 来, 神 经 符 号 人 工 智 能 ( neuro-symbolic AI)
              的兴起为平衡“可解释”与“自适应”提供了思路,LI
                                                                            记忆         执行与技能        反馈
              等 [9-11]  受到神经符号主义的启发,通过构建信号处理
              符号算子库,利用神经网络进行自学习地调度组装,
                                                                         储存
              执行并优化不同可解释算子从而搭建端到端的可解                                                    反思与观测
                                                                           提供上下文
              释网络。同时,以语言符号为载体训练的大型语言
              模型(LLM)在推理与规划方面的突破展示了跨领域
                                                                                          结果
              的通用智能潜力。传统            LLM  在故障诊断方面的应

              用主要集中于两个方面:一是处理文本类数据(如维                                   图 1 大语言模型驱动的智能体工作流
              修日志),无法分析原始振动信号,例如文献                    [12-13]       Fig. 1 Large language model-driven agent workflows
   81   82   83   84   85   86   87   88   89   90   91