Page 166 - 《软件学报》2025年第9期
P. 166

李文艺 等: 增量构造式随机循环神经网络                                                            4077


                    ● 算法                    f L  的输出权重.            v L = [v ,v ,...,v ] , 其中  (  j = 1,2,...,q) 的计算
                                                                                       j
                                                                               q T
                                                                          2
                                                                        1
                                                                                      v
                                                        f L  的输出权重
                          IR-1: 仅计算新增节点
                                                                        L  L   L       L
                 如公式   (13) 所示:

                                                                  T
                                                             T
                                                        < (e  j  ) , s L (X) >
                                                     j
                                                    v =    L−1                                       (13)
                                                     L
                                                               T 2
                                                           ||s L (X) ||
                                  t t = 1,2,...,N) 时刻的输出如公式
                              y L  在   (                     (14) 所示:
                    增量后网络

                                                    y L (t) = y L−1 (t)+v L s L (t)                  (14)
                 其中,                  f L  的输出状态.            V L = [V L−1 ,v L ] X  输入后,  y L  的所有输出如公式  (15) 所示:
                                                                       .
                     s L (t) 为新增隐含节点              y L  的输出权重
                                      y L (X) = [y L (1), y L (2),...,y L (N)] = V L S L (X) = y L−1 (X) + v L s L (X)  (15)
                    若输出误差     e L = Y −y L (X) 不满足设定值且隐含节点数未达到最大设定值, 则继续添加新的隐含节点.
                    ● 算法  IR-2: 计算更新  IRRNN  的所有输出权重. 输出权重矩阵满足:

                                              ∗   ∗  ∗   ∗
                                             V = [v ,v ,...,v ] = argmin||Y −V L S L (X)||           (16)
                                              L
                                                         L
                                                    2
                                                  1
                                                              V L
                    由最小二乘法可得:

                                                  V = [v ,v ,...,v ] = YS L (X) +                    (17)
                                                   ∗
                                                              ∗
                                                       ∗
                                                         ∗
                                                       1
                                                         2
                                                              L
                                                   L
                                                                                ∗
                                                                                  ∗
                 其中,  S L (X)  +   为  S L (X) 的  Moore-Penrose 逆矩阵. 添加  f L  之后, 增量后的网络记为  ,  y  所有输出为:
                                                                               y

                                                                                L  L
                                                                              ∗
                                             ∗
                                                  ∗
                                                         ∗
                                                                ∗
                                       ∗
                                      y (X) = [y (1), y (2),...,y (N)] = V S L (X) = y ∗  (X) + v s L (X)  (18)
                                       L     L    L      L     L       L−1    L
                                                                               q∗ T T
                                                                   1∗ T
                                                                        2∗ T
                 其中,  v  表示新增隐含节点      f L  的输出权重.  y  的输出误差  e = [(e ) , (e ) ,..., (e ) ]     = Y −y (X). 在   时刻  y  的
                                                                                                t
                                                                                                     ∗
                                                              ∗
                                                                                         ∗
                      ∗
                                                   ∗
                                                   L
                                                                        L
                      L
                                                                   L
                                                              L
                                                                                                     L
                                                                                         L
                                                                               L
                 输出为:

                                                                 ∗
                                                     ∗
                                                    y (t) = y ∗ L−1 (t)+v s L (t)                    (19)
                                                                 L
                                                     L
                 其中,  y (t) y ∗  (t) 分别表示增量前网络   y  与增量后网络  y ∗   在  t 时刻的输出, 若输出误差   e  不满足设定值且隐含
                         ,
                                                                                       ∗
                                                ∗
                      ∗
                      L    L−1                  L            L−1                       L
                 节点数未达到最大设定值, 则继续添加新的隐含节点.
                    上述两种算法分别从局部优化与全局优化的角度考虑对网络输出权重进行优化, 两种算法的差异如下: 当有
                 新增节点时, 算法     IR-1  仅计算新增节点    f L  的输出权重, 其余节点的权重保持不变, 这体现了局部优化的思想. 当有
                 新增节点时, 算法     IR-2  重新增量后网络的所有输出权重, 这体现了全局优化的思想.

                 2.3   IRRNN  的逼近性能
                    由第  2.2  节可知算法   IR-1  与算法  IR-2  是  IRRNN  输出权重的两种计算方法, 本节定理       1  证明算法  IR-1  具有
                 万能逼近能力. 借助定理       1  的结论, 定理  2  证明了算法   IR-2  也具有万能逼近能力. 文中      ∥·∥ 表示向量的    2  范数, 或
                        F  范数.
                 者矩阵的
                    定理  1.  X = [x(1), x(2),..., x(N)] ∈ R p×N ,  Y = [y(1),y(2),...,y(N)] ∈ R q×N  分别为动态系统的输入与输出;  y L−1  为含
                   L−1 个隐含节点的                            y L−1 (X) ∈ R q×N , 输出误差如公式
                 有                 IRRNN, 其输入为   X, 输出为                           (7) 所示; 给定非负数列     {r L },
                     ∞ ∏
                                                                                                      q T
                                                                                                 2
                                                                                               1
                 满足    (1−r L ) = 0; 若第   L 个隐含节点   f L  的所有输出状态  s L (X) 满足公式  (8),   f L  的输出权重为  v L = [v ,v ,...,v ] ,
                                                                                               L  L   L
                     L=1
                     v j = 1,2,...,q) 如公式
                      j
                 其中  (                 (13) 所示. 把   f L  添加到  y L−1  后, 新增之后的  IRRNN  为  y L , 其输出  y L (X) 如公式  (15) 所
                      L
                      lim ∥Y −y L (X)∥ = 0.
                 示, 则
                      L→∞
                                              j
                                  ,
                    证明: 分别从    e L−1 e L  中取  e  j  , e (  j = 1,2,...,q). 新增节点  f L  使公式  (8) 成立,   f L  的输出权重按公式  (13) 计
                                          L−1  L
                 算, 得:

                                             j T 2   j  T  j   T T  j  T  j   T
                                          ||(e ) ||  ((e  ) −v s L (X) ) ((e  ) −v s L (X) )
                                             L   =   L−1   L       L−1   L
                                              T 2
                                          ||(e  j  ) ||        ||e j  || 2
                                            L−1                 L−1
                                                                T
                                                           T
                                                      < (e  j  ) , s L (X) > 2
                                                 = 1−   j  L−1      ⩽ 1−r L < 1                      (20)
                                                     ||(e  ) || ||s L (X) ||
                                                          T 2
                                                                 T 2
                                                        L−1
   161   162   163   164   165   166   167   168   169   170   171