Page 59 - 《中国医疗器械杂志》2026年第2期
P. 59
Chinese Journal of Medical Instrumentation 2026年 第50卷 第2期
综 合 评 述
4 学习机制与特性启发建模 一,是持续学习并有效抵御遗忘的能力,这也成为
类脑人工系统建模的重要目标。弹性权重固化
生物神经系统主要依赖突触可塑性与信息反向 (elastic weight consolidation, EWC)通过引入费舍
传递等机制实现学习,这为ANN的发展提供了重 尔信息矩阵评估各参数对已学任务的重要性,并在
要启发。在机制层面,ANN引入了多样化的学习 新任务训练中对关键权重施加约束,从而保持
规则与参数更新策略;在特性层面,ANN则着重 对旧有知识的表达能力 [70] 。类似地,突触智能
提升持续学习与泛化能力,推动类脑学习向更高 (synaptic intelligence, SI)方法通过在训练过程中
效、更具适应性的方向发展。 持续追踪参数贡献度,对重要突触施加更强的稳定
4.1 Hebbian学习与STDP规则 性约束,有效抑制了任务间的干扰效应 。其他机
[71]
Hebbian学习以“共同激活的神经元连接增 制如情境门控(context gating),受“情境依赖性
强”为核心原则,已在多类神经形态计算系统中 记忆巩固”机制启发,通过在不同任务或环境中引
得到广泛应用与扩展 。其中,Oja规则通过引入 入门控模块,动态调节网络的激活路径与记忆通
[61]
[62]
归一化约束有效抑制了权重发散 ,为自组织映射 道,实现对多任务表征的选择性访问与记忆保
与特征提取提供了稳定可靠的解决方案;BCM 护 。这些方法在连续任务学习中显著缓解了“灾
[72]
(Bienenstock-Cooper-Munro)模型进一步引入了 难性遗忘”问题,为构建具备长期适应能力的类脑
滑动阈值机制,在保持可解释性的同时赋予网络非 系统奠定了基础。
[63]
线性的突触调节能力 。这类规则已被广泛嵌入多 除持续学习与抗遗忘能力外,提升泛化能力
种神经网络架构,作为无监督或局部可塑性策略, 同样是类脑智能建模的关键目标。相关机制主要
有效增强了模型的神经动态适应能力。例如,在感 可分为三类:经验迁移、自主构建与行为塑造。经验
知映射任务与SNN中,Hebbian规则与STDP规则已 迁移类方法包括迁移学习(transfer learning) 、
[73]
被广泛应用于时空特征学习 。 元学习 、少样本学习(few-shot learning) 及课
[64]
[74]
[75]
4.2 替代反向传播的机制探索 程学习 [76] 等,其核心在于将已有知识经验迁移
尽管反向传播是现代深度学习的核心算法,但 并适配至新任务,构建跨任务的一致表征与泛化
其生物合理性与可扩展性一直备受质疑。为此,研 结构;自主构建类方法则强调在缺乏外部监督
究者提出了一系列替代机制,旨在平衡生物可解释 时,模型依靠自主生成的训练信号与内部结构进
性与计算可行性。在局部可塑性之外,自反向传播 行自组织学习,典型代表有自监督学习(self-
(self-backpropagation, SBP)通过使突触可塑性沿 supervised learning) 、生成对抗网络(generative
[77]
着网络层级自发“反向”传播并形成协调更新,以 adversarial network, GAN) 和自蒸馏网络(born-
[78]
本地信号实现近似的信用分配,在SNN与ANN中 again network, BAN) 等;行为塑造类方法以行
[79]
以更低的计算/存储开销取得有效的训练表现 ; 为反馈为主要驱动力,涵盖模仿学习 与强化学
[65]
[80]
预测误差传播与迭代目标调整(predictive error 习 。其中,强化学习通过奖励机制优化策略与
[81]
propagation and iterative target adjustment, PEPITA) 决策路径,在序列决策与自主控制任务中展现出
通过将误差预测与反馈连接相结合,实现了局部参 与生物多巴胺调节系统相似的功能特性。
数更新,从而避免了误差信号的全局反向传播 ; 总体而言,上述持续学习与泛化学习范式模拟
[66]
Feedback Alignment(FA)则使用随机固定的反馈 了生物智能在适应性、抗干扰、快速学习与自我驱
权重替代精确的梯度通路,在特定条件下仍能保持 动等方面的核心特征,是构建鲁棒类脑智能系统的
令人满意的性能 。同时,局部损失函数设计 与 重要路径。
[68]
[67]
预测编码框架 等已成为近年来的研究热点。这些 4.4 特定生物学习特性的启发
[69]
方法普遍通过降低对全局梯度的依赖、强化局部更 除常见的神经科学模式生物外,越来越多的研
新机制与提升结构模块化程度,在保持性能的同时 究开始关注特定生物的学习行为,并尝试从其独特
推进了更具生物合理性与计算可行性的学习策略的 的学习模式中汲取设计灵感,以提高模型的可解释
发展。 性和优化参数效率。例如,NIV等 提出的基于预
[82]
4.3 持续学习与泛化学习 测Hebbian可塑性的蜜蜂觅食决策模型,使强化学
生物体在动态环境中展现的核心智能特征之 习框架能够自然地拟合蜜蜂在不确定资源环境中
173

