Page 169 - 《软件学报》2025年第9期
P. 169

4080                                                       软件学报  2025  年第  36  卷第  9  期



                 //第  3  阶段: 计算输出参数 (步骤   16, 17)
                 16. 按公式   (13) 计算并构造  v L , 保存  v L  到  .
                                                  V
                 17. 计算   ||e L || = ||Y −VS L (X)||, 更新  ||e 0 || := ||e L ||,L := L+1.
                 18. END WHILE
                                  in
                 19. RETURN  V, W, W , B
                    算法  IR-2  伪代码见算法   2.
                 算法  2. 算法  IR-2.

                 训练数据: 同算法     IR-1.
                                ∗
                 初始化: 输出权重     V := [], 其余参数同算法   1.
                 1. WHILE  L < L max  and  ||e 0 || > ε Do
                 //第  1、2  阶段: 与  IR-1  第  1、2  阶段相同.
                 //第  3  阶段: 确定输出参数  (步骤  2, 3)
                 2.  根据公式   (16) 计算  V = YS L (X) ,
                                             +
                                     ∗
                                                     ,
                          ∗       ∗                ∗
                 3.  计算  ||e || = ||Y −V S L (X)||, 更新  ||e 0 || := ||e || L := L+1
                          L
                                                   L
                 4. END WHILE
                 5. RETURN  V , W, W , B
                                  in
                            *
                    第   L 个隐含节点   f L  添加到  IRRNN  后, 利用算法  IR-1  计算输出权重的时间复杂度为      O(NL); 利用算法   IR-2  计
                                       O(NL )(采用  QR  分解计算逆矩阵). 上述分析表明, 对于单独一次计算, 算法               IR-2  的
                                           2
                 算输出权重的时间复杂度为
                 时间复杂度较大, 但是后继实验表明利用算法              IR-2  训练  IRRNN  时需要较少的隐含层节点即可实现较好的学习效
                 果, 因此实际应用中算法       IR-2  耗时未必偏大.
                    在设定参数时满足:       λ W > 0 0<λ W in ⩽ 1 λ b > 0. 算法  IR-1  伪代码中“取   Ω 中最大   ξ L  所对应   Ξ 中的  w L , b L , w in  分
                                                  ,
                                         ,
                                                                                                     L
                 别保存到   W, b, W  in  中”即是执行公式  (11) 的优选操作  (从  Ξ 中选择使最优隐含节点  ).
                                                                                 f L

                 3   仿真实验
                    第  3.1  节验证  IRRNN  中隐含节点的动态特性. 第       3.2  节进行了动态系统逼近实验与时间序列预测实验. 第
                 3.3  节用  IRRNN  对水泥熟料中游离氧化钙      (f-CaO) 进行软测量, 验证本文模型解决实际问题的能力. 用本文方法
                 与单层   RNN、单层   LSTM、ESN、GESN    [33] 、PDSM-ESN [34] 等方法进行实验比较. 用网络的紧凑性、训练时间、
                 网络精度   (均方误差根和     RMSE) 作为评价指标, RMSE     的计算如公式     (25) 所示:

                                                        √
                                                           1  ∑ N
                                                  RMSE =        ˆ y(t)−y(t)                          (25)
                                                          N   t=1
                 其中,  y(t) 为真实值,  ˆ y(t) 为网络输出值,  N  为样本数量. 实验中给出了多次实验        RMSE  的平均值及其标准差. 实验
                 硬件环境: Core(TM) i3-10100 CPU@3.60 GHz. 操作系统  Windows 10, 编程语言为  Python, 编程环境为  Spyder 3.

                 3.1   IRRNN  的动态特性仿真
                                           in              in                                    in
                                                                                                      ,
                    首先改变激活函数        s(t) = f(w s(t −1)+b)  的参数  w   与  b, 验证其动态特性与权重之间的关系. 当    w = 0.7 b
                 分别取{−0.8, −0.1, 0.1, 0.8}时, 隐含节点的唯一平衡点分别为{−0.89, −0.30, 0.30, 0.89}. 隐含节点初始状态分别为
                 {−0.99, −0.594, −0.198, 0.198, 0.594, 0.99}时, 其零输入响应如图  3  中曲线所示. 由图  3  可知, 当  b 改变时, 平衡点位
                 置随之改变, 但是隐含节点最终收敛到相应的稳定平衡点                  (如图  3  中  A, B, C, D  所示).
                      w = 1.7 b = −0.3 时, 隐含节点  3  个平衡点分别是{−0.959, 0.498, 0.753}. 其中, 0.753  和−0.959  是稳定平衡
                        in
                             ,
                    当
                 点, 0.498  是不稳定平衡点. 从   [−1,1] 随机取  50  个值做为初始状态, 其输出响应如图        4  所示. 由图  4  可知: 初始状态
   164   165   166   167   168   169   170   171   172   173   174