Page 367 - 《软件学报》2025年第4期
P. 367
俞诗航 等: 神经形态计算: 从脉冲神经网络到边缘部署 1773
Neurogrid [169] 是一种数模混合神经形态芯片, 它灵活地利用神经元离子通道的动态特性和晶体管阈下区域的
电学特性之间的相似性来设计神经元回路和突触连接. Neurogrid 的硬件系统由 16 个神经网格芯片的 PCB 组成,
每个芯片有 256×256 个模拟神经元, 采用 180 nm CMOS 技术制造, 能够对具有数十亿个突触连接和 100 万个神
经元的大脑进行实时生物模拟.
BrainScaleS [170] 采用 8 英寸硅晶片, 片上集成了 352 个计算芯片, 采用超阈值模拟电特性进行神经元动力学仿
真. BrainScale 系统实现了自适应指 IF 神经元模型和突触, 并支持 STDP 规则的在线学习, 通过 FPGA 模块进行计
算核心之间的路由通信, 可以实现远超生物大脑的运行速度, 常用于加速具有精确生物神经行为的类脑神经网络
的时间模拟.
ROLLS [171] 只有 256 个神经元和 128 000 个突触, 采用亚阈值模拟电路实现神经元和突触动力学, 常用于模拟
生物神经系统的物理活动、研究计算神经科学模型和构建类脑计算系统. 在硬件架构上, ROLLS 芯片将内存和计
算共置, 包括一个可配置的突触电路阵列, 其中的脉冲神经元可产生符合生物特征的响应特性, 从而表现出各种真
实行为.
DYNAPs [172] 是采用超阈值模拟电特性实现的数模混合神经形态硬件平台, 包含 9 块芯片, 单芯片含 4 个计算
SpiNNaker 电路板允许自由编程, 支持包括
核, 每个计算核拥有 256 个神经元. 该系统采用两级路由方案, 芯片间采用 2D 网格路由拓扑, 片内的计算核心则
通过树状路由进行通信, 结合了网格拓扑的低带宽和树状拓扑的低延迟优点, 拥有很高的内存效率.
数模混合神经形态芯片的优势在于它可以将数字和模拟电路集成在同一芯片上, 减少了电路的面积、功耗和
成本, 在一些仿生学应用实现了全面的性能优势, 非常适合实时研究系统与环境的交互问题.
3.2.2 全数字神经形态芯片
虽然模拟电路可以相对容易地复现较为复杂的神经元动力学, 但它也面临着抗干扰能力差、可编程性不足以
及难以仿真等问题. 在数字电路中, 神经元的所有变量都用比特位表示, 变量的精度取决于表示变量的比特数, 这
种可配置的数据精度极大地影响了基本操作的能耗和变量存储的内存要求. 与模拟电路相比, 数字电路设计的最
大优势在于变量的精度是可控和有保证的. 此外, 数字电路硬件的设计也可以采用最先进的芯片设计和制造技术,
拥有较为成熟的工艺流程. 目前, 基于数字电路的稳定性和可靠性, 全数字神经形态芯片在工业界得到了更广泛的
应用. 纯数字电路实现的芯片可以构建超低功耗的大规模神经形态系统, 并精确再现 SNN 模型.
[173]
TrueNorth 是 IBM 公司于 2014 年推出的全数字神经形态芯片, 包含 54 亿个晶体管和 4 096 个神经突触内
核, 面积仅为 430 mm , 可达到 100 万个神经元和 2.56 亿个突触的计算规模. TrueNorth 支持 LIF 神经元模型及其
2
诸多变体, 采用事件驱动的异步同步电路混合设计方案, 不依赖全局时钟协调工作, 不会因芯片故障而影响整体工
作, 具有良好的可扩展性和可靠性. 事件驱动的特性使得该芯片工作功耗极低, 在模拟百万神经元规模的 SNN 时
也仅有至多百毫瓦的功耗, 可实际应用于图像识别和语音处理等领域. 尽管 TrueNorth 为神经形态芯片的设计带
来了突破性进展, 但其仅支持 SNN 的推理, 不支持片上学习, 需要额外的训练设备进行参数更新, 还存在一定发展
空间.
SpiNNaker [174] 是一个大型数字神经形态硬件平台, 由 48 个芯片组成. 单个芯片含有 18 个 ARM 处理核心和
128 MB 的 DRAM 存储器, 每个 ARM 核可以仿真近 1 000 个神经元. PyNN 接口 [175] 的存在以及 ARM 核心的高度
灵活性使 LIF、Izhikevich 与 H-H 等脉冲神经元模型和在线的突触学
习, 能够模拟大规模 SNN 模型.
[176]
Loihi 是英特尔设计的全数字神经形态芯片, 采用 14 nm 工艺技术制造, 包含 20.7 亿个晶体管, 128 个内核,
单核包含最多 1 024 个神经元和 16 MB 突触容量, 可实现多达 13 万个神经元和 1.3 亿个突触. 此外, 每个内核中
嵌入的学习引擎可实现片上学习, 支持多种神经形态可塑性、复杂的神经元模型和信息编码协议, 能模拟各类
SNN 模型, 具有非常高的灵活性. Loihi 同时支持稀疏网络压缩、内核间多播通信、可变突触格式和基于种群的
分层互连等机制, 拥有远超传统处理器的计算能效. 在 Loihi 芯片的基础上, 英特尔还推出了 Pohoiki Springs [177] .
该系统是英特尔最大的机架式神经形态系统, 集成了 768 个 Loihi 芯片, 拥有 1 亿个神经元和 990 亿个突触, 运行
功耗低于 500 W, 整体神经容量与小型哺乳动物相当.