Page 16 - 《软件学报》2020年第9期
P. 16

葛道辉  等:轻量级神经网络架构综述                                                               2637


         的控制器,实现用较少的 GPU 时间实现快速压缩,同时也支持连续的动作空间.
                     Table 1    Comparison of lightweight model methods based on reinforcement learning
                                   表 1   基于强化学习的轻量级模型方法的比较
                                               NAS        NT         N2N        AMC
                       Optimize for accuracy    √          √          √          √`
                        Optimize for latency                                      √
                      Simple, non-RNN controller                                  √
                    Fast exploration with few GPUs         √          √           √
                       Continuous action space                                    √

             针对不同的应用场景,AMC 提出了两种压缩策略搜索协议:对时效性要求较高的场景,例如移动应用程序、
         自动驾驶和广告排名等,通过限制搜索空间,即在模型大小和滤波器的数量等方面进行压缩,以获得最大的硬件
         资源;对性能要求较高的场景,例如拍照识图和谷歌图像等,通过研究模型的精度和规模设计奖励函数,实现模
         型的压缩并保持模型的精度.图 12 表示了 AMC 模型压缩算法流程图.


                      人工压缩:子最优
                                                                                卷积层t+1

                                                         奖励=-损失*
                                                优化器                               ?%
                                                          log(FLOP)
                     初始网络     压缩网络
                                      AMC                动作:稀疏率                  卷积层t
                                       engine   执行器
                                                           a t压缩                  50%
                                                  特征       特征提取                 卷积层t-1

                                                        S t =[N,C,H,W,i,...]      30%
                    初始网络     压缩网络               代理:DDPG


                                                                       环境:通道裁剪
                                Fig.12    The structure of AMC compression algorithm
                                       图 12  AMC 模型压缩算法结构图
             AMC 模型通过强化学习算法训练代理,实现动作的预测并计算稀疏性,执行压缩.同时,快速评估压缩后的
         模型性能,通过优化损失函数,鼓励更小、更精确的结果更新代理.AMC 在 ResNet-50 上评估了压缩的性能,并测
         试了压缩模型从分类到目标检测的泛化能力.实验表明,AMC 提供了比手工设计的启发式策略更优的性能.对
         于 ResNet-50,压缩比从 3.4 倍提高到了 5 倍而不损失准确率,如图 13 所示.

                        50%                                  ResNet-50 人工密集裁剪
                             50%
                                                             ResNet-50 AMC剪裁(越低越好)

                        40%     43%
                    参数密度  #非零权重/总权重  30%  31%  28%  31% 28%  30%  23%  30%      29%  20%
                        20%

                        10%                                       19%   20%
                                                                           10%
                        0%
                              Conv 1  ResBlock 1  ResBlock 2  ResBlock 3  ResBlock 4  FC  Total
                       Fig.13    Comparison between AMC and artificial design compression algorithm
                                    图 13  AMC 与人工设计压缩算法的比较
   11   12   13   14   15   16   17   18   19   20   21