Page 59 - 《中国医疗器械杂志》2026年第2期
P. 59

Chinese Journal of Medical Instrumentation                                         2026年 第50卷 第2期

                                                    综     合     评    述



               4    学习机制与特性启发建模                                 一,是持续学习并有效抵御遗忘的能力,这也成为
                                                                                     类脑人工系统建模的重要目标。弹性权重固化
                  生物神经系统主要依赖突触可塑性与信息反向                          (elastic weight consolidation, EWC)通过引入费舍
              传递等机制实现学习,这为ANN的发展提供了重                            尔信息矩阵评估各参数对已学任务的重要性,并在
              要启发。在机制层面,ANN引入了多样化的学习                            新任务训练中对关键权重施加约束,从而保持
              规则与参数更新策略;在特性层面,ANN则着重                            对旧有知识的表达能力             [70] 。类似地,突触智能
              提升持续学习与泛化能力,推动类脑学习向更高                             (synaptic intelligence, SI)方法通过在训练过程中
              效、更具适应性的方向发展。                                     持续追踪参数贡献度,对重要突触施加更强的稳定
               4.1    Hebbian学习与STDP规则                          性约束,有效抑制了任务间的干扰效应 。其他机
                                                                                                    [71]
                  Hebbian学习以“共同激活的神经元连接增                        制如情境门控(context gating),受“情境依赖性
              强”为核心原则,已在多类神经形态计算系统中                             记忆巩固”机制启发,通过在不同任务或环境中引
              得到广泛应用与扩展 。其中,Oja规则通过引入                           入门控模块,动态调节网络的激活路径与记忆通
                                  [61]
                                            [62]
              归一化约束有效抑制了权重发散 ,为自组织映射                            道,实现对多任务表征的选择性访问与记忆保
              与特征提取提供了稳定可靠的解决方案;BCM                             护 。这些方法在连续任务学习中显著缓解了“灾
                                                                  [72]
              (Bienenstock-Cooper-Munro)模型进一步引入了                难性遗忘”问题,为构建具备长期适应能力的类脑
              滑动阈值机制,在保持可解释性的同时赋予网络非                            系统奠定了基础。
                                 [63]
              线性的突触调节能力 。这类规则已被广泛嵌入多                                除持续学习与抗遗忘能力外,提升泛化能力
              种神经网络架构,作为无监督或局部可塑性策略,                            同样是类脑智能建模的关键目标。相关机制主要
              有效增强了模型的神经动态适应能力。例如,在感                            可分为三类:经验迁移、自主构建与行为塑造。经验
              知映射任务与SNN中,Hebbian规则与STDP规则已                      迁移类方法包括迁移学习(transfer learning) 、
                                                                                                           [73]
              被广泛应用于时空特征学习 。                                    元学习 、少样本学习(few-shot learning) 及课
                                       [64]
                                                                       [74]
                                                                                                        [75]
               4.2    替代反向传播的机制探索                               程学习    [76] 等,其核心在于将已有知识经验迁移
                  尽管反向传播是现代深度学习的核心算法,但                          并适配至新任务,构建跨任务的一致表征与泛化
              其生物合理性与可扩展性一直备受质疑。为此,研                            结构;自主构建类方法则强调在缺乏外部监督
              究者提出了一系列替代机制,旨在平衡生物可解释                            时,模型依靠自主生成的训练信号与内部结构进
              性与计算可行性。在局部可塑性之外,自反向传播                            行自组织学习,典型代表有自监督学习(self-
              (self-backpropagation, SBP)通过使突触可塑性沿              supervised learning) 、生成对抗网络(generative
                                                                                   [77]
              着网络层级自发“反向”传播并形成协调更新,以                            adversarial network, GAN) 和自蒸馏网络(born-
                                                                                         [78]
              本地信号实现近似的信用分配,在SNN与ANN中                           again network, BAN) 等;行为塑造类方法以行
                                                                                    [79]
              以更低的计算/存储开销取得有效的训练表现 ;                            为反馈为主要驱动力,涵盖模仿学习 与强化学
                                                         [65]
                                                                                                    [80]
              预测误差传播与迭代目标调整(predictive error                    习 。其中,强化学习通过奖励机制优化策略与
                                                                  [81]
              propagation and iterative target adjustment, PEPITA)  决策路径,在序列决策与自主控制任务中展现出
              通过将误差预测与反馈连接相结合,实现了局部参                            与生物多巴胺调节系统相似的功能特性。
              数更新,从而避免了误差信号的全局反向传播 ;                                总体而言,上述持续学习与泛化学习范式模拟
                                                         [66]
              Feedback Alignment(FA)则使用随机固定的反馈                  了生物智能在适应性、抗干扰、快速学习与自我驱
              权重替代精确的梯度通路,在特定条件下仍能保持                            动等方面的核心特征,是构建鲁棒类脑智能系统的
              令人满意的性能 。同时,局部损失函数设计 与                            重要路径。
                                                        [68]
                             [67]
              预测编码框架 等已成为近年来的研究热点。这些                             4.4    特定生物学习特性的启发
                           [69]
              方法普遍通过降低对全局梯度的依赖、强化局部更                                除常见的神经科学模式生物外,越来越多的研
              新机制与提升结构模块化程度,在保持性能的同时                            究开始关注特定生物的学习行为,并尝试从其独特
              推进了更具生物合理性与计算可行性的学习策略的                            的学习模式中汲取设计灵感,以提高模型的可解释
              发展。                                               性和优化参数效率。例如,NIV等 提出的基于预
                                                                                                [82]
               4.3    持续学习与泛化学习                                 测Hebbian可塑性的蜜蜂觅食决策模型,使强化学
                  生物体在动态环境中展现的核心智能特征之                           习框架能够自然地拟合蜜蜂在不确定资源环境中


                                                             173
   54   55   56   57   58   59   60   61   62   63   64