Page 364 - 《软件学报》2025年第4期
P. 364

1770                                                       软件学报  2025  年第  36  卷第  4  期


                 3   神经形态硬件平台

                    随着物联网     (Internet of Things, IoT) 时代任务的日益复杂, 以及需要部署的网络规模的不断增大, 在功率、能
                 量和计算资源受限的边缘设备中训练和部署这些                  DNN  已成为一项艰巨的任务        [124] . 相较于高能耗的  ANN, SNN
                 凭借其理论上高效的事件驱动计算特性, 已成为高能效的部署方案. 然而, 由于传统的深度学习平台无法彻底发挥
                 出  SNN  高能效的潜力, 神经形态硬件平台的出现为            SNN  的边缘部署打开了一扇窗户. 神经形态硬件设计的最初
                 灵感来自建立与人脑等效的电子系统, 以模仿人脑的计算能力                    [125] . 随着摩尔定律即将结束, 与登纳德缩放       [126] 相关
                 的功率需求不断增加, 以及        CPU  和内存之间的低带宽       (冯·诺伊曼瓶颈), 神经形态硬件平台受到了越来越多的关
                 注, 并被视为执行神经形态计算的可行解决方案. 由于其固有的并行性, 低能量开销和更小的物理空间占用, 神经
                 形态硬件可以在资源受限的嵌入式系统以及               IoT  中的边缘设备上高效实现机器学习任务            [127] .
                    不同于传统的冯·诺依曼架构, 神经形态硬件通常采用去中心化的可扩展架构, 通过路由网络交换中间结果数
                 据, 允许多计算核心同时工作. 同时, 在神经形态硬件平台中, 外部存储器将不复存在, 取而代之的是存储单元与计
                 算单元的高度贴合, 从而带来极高的并行性和访存效率. 神经形态硬件旨在最大限度地降低能耗和成本, 同时尽可
                                 数据集上的实验表明, 在明显的噪声条件下
                 能保持高精度.由于这些特性与          SNN  的理念十分契合, 神经形态硬件可以看作是              SNN  及其应用部署的理想硬件
                 平台.
                    下面将详细介绍当下流行的适合部署              SNN  的神经形态硬件平台以及一些硬件映射方法.

                 3.1   现场可编程门阵列
                    FPGA  是一种可编程逻辑器件, 它可以根据用户的需求进行可重构的硬件设计. 相比于传统的冯·诺依曼架构
                 处理器   (如  CPU  和  GPU), FPGA  通常具有更低的功耗   [128] , 这对于在嵌入式设备或低功耗环境中部署神经网络模
                 型非常有利. 与专用集成电路         (application specific integrated circuit, ASIC) 相比, 由于  ASIC  的设计、验证和制造的
                 高非重复性工程成本和时间难以跟上神经网络模型改进的步伐                       [129] , 而作为可配置工具的   FPGA, 由于其灵活性,
                 可以根据具体的神经网络结构和算法进行定制化设计, 保证了更短的开发时间, 因此更适合当今快速发展的神经
                 形态计算领域.
                    尽管  FPGA  本身并非专门设计用于神经形态计算, 但它具有高度的灵活性和不俗的并行计算能力, 同时具备
                 高能效和位级操作的特点, 因此在一定程度上被认为是可以模拟生物神经网络自然可塑性的神经形态硬件平台.
                 研究表明, 在现代     FPGA  平台上部署时, SNN    可以凭借事件驱动的特性和更高的内存组织效率, 达到比                  ANN  更低
                 的能源需求这一预期        [130] . 结合  SNN  在边缘设备部署时的明显优势, 目前的研究热点之一是开发基于                 FPGA  的
                 SNN  加速器, 以实现高性能神经形态计算, 将人工智能带向边缘计算场景                   [131] .
                    在信号处理领域, SNN       相较于   ANN  具备更强的时空信息的处理能力, 脉冲神经元事件驱动的特点也使得
                 SNN  的计算更高效. 文献     [132] 基于  FINN [133] 框架高效利用了  FPGA  的并行资源, 并结合   SNN  在序列数据处理上
                 的优势, 开发了一种流式       SNN  架构  S2N2, 在射频信号识别任务上使内存利用率提高了              3  个数量级以上.
                    在语音识别领域, 文献       [134] 在  10  块  Cyclone 系列  FPGA  上设计了一种基于  SNN  的数字感知系统. 该系统采
                 用全并行流水线方案, 最高频率可达           107.28 MHz, 最大吞吐量为    5 364 Mb/s, 能效为  845.85 μJ, 高效地完成了听觉
                 感知任务. 在   TIMIT                                   (信噪比为   20 dB), 该系统的语音识别准确率高达
                 85.75%, 并且随着信噪比的下降, 准确率的衰减幅度也很小, 是目前最先进的基于                    SNN  的听觉感知系统. 文献     [135]
                 提出了一种基于      SNN  的与动物运动相关的声音识别系统. 通过将             SNN  部署在  FPGA  平台上, 该神经形态听觉系
                 统产生了类似于生物耳蜗的脉冲输出的表示. 即使在声音中存在相同强度的白噪声时, 其基于信噪比的检测系统
                 也能达到   91%  以上的准确率.
                    在智慧医疗领域, 文献        [136] 提出了一个神经形态系统, 将神经记录头戴式设备与                  SNN  处理核心集成在
                 XEM7360 FPGA 上, 用于处理颅内脑电图, 并展示了如何可靠地检测高频振荡, 从而实现了最先进的准确性、敏
                 感性和特异性. 该工作也是利用混合信号神经形态计算技术实时识别颅内脑电图中相关特征的首次可行性研究.
                    在机器人领域, 文献      [36] 基于  FPGA  实现了具有可重构连接性的        SNN, 并应用于   Khepera 机器人的避障任务.
   359   360   361   362   363   364   365   366   367   368   369