Page 181 - 《软件学报》2025年第9期
P. 181

4092                                                       软件学报  2025  年第  36  卷第  9  期


                 输出由输入唯一确定与隐含节点的初始状态无关.
                    证明: 由于   IRRNN  的输出是隐含状态的线性叠加, 因此若能证明任意隐含节点的反馈权重                       0 < |w | ⩽ 1 时, 该
                                                                                               in
                 隐含节点有唯一稳定平衡点, 且稳态输出与初始状态无关, 则可证明该定理.
                        in                                                                         x(t). 设
                                                                                        (
                      w, w , b 表示任意隐含节点的输入权重, 反馈权重与偏置量, 隐含节点的状态记为                 s(t) ∈ R t ⩾ 0), 输入为
                                               II
                                              ,
                                           I
                                                                            II
                                                                              (
                                                                        I
                 该隐含节点的任意两个初始状态           s (0) s (0) 所对应的输出状态分别为      s (t), s (t) t ⩾ 1), 由拉格朗日中值定理可知:

                                     II
                                                                           in I
                                          I
                                                       in II
                                     s (t)− s (t) = f(wx(t)+w s (t −1)+b)− f(wx(t)+w s (t −1)+b)
                                                           I
                                                    II
                                                ′
                                             = f (η t )(s (t −1)− s (t −1))                         (A10)
                    可得:

                                      II   I      ′    II   I
                                     s (1)− s (1) = f (η 1 )(s (0)− s (0))
                                     
                                     
                                     
                                      II   I          II   I              II   I
                                     s (2)− s (2) = f (η 2 )(s (1)− s (1)) = f (η 2 )f (η 1 )(s (0)− s (0))
                                                                  ′
                                                  ′
                                                                      ′
                                     
                                     
                                     
                                                                                                   (A11)
                                             ...
                                     
                                     
                                     
                                                         )
                                                (∑
                                                   t
                                      II   I               II   I
                                     s (t)− s (t) =  f (η i ) (s (0)− s (0))
                                                       ′
                                     
                                                    i=1
                        in
                    若  |w | < 1, 则对于任意  , 有:
                                      η t
                                                                  in
                                                                2
                                                    ′
                                                  |f (η t )| = |(1− f(η t ) )w | < 1                (A12)
                    因此,

                                                        (∑      )
                                                           t
                                                     lim     f (η i ) = 0                           (A13)
                                                             ′
                                                     t→∞   i=1
                                I
                           II
                 即  t → ∞ 时  s (t)− s (t) = 0.
                        in                                             |f (−b)| = |(1− f(−b) )| = 1 取最大值. 此时曲
                                                                                      2
                                                                        ′
                    当   |w | = 1 时, 激活函数为   s(t) = f(s(t −1)+b). 当  s(t −1) = −b 时,
                 线上任意两个点       (  s (t −1), s (t))  与  (s (t −1), s (t)) 之间的斜率的绝对值小于. 仅当  s (t −1) → −b s (t) = −b(或
                                              I
                                                    I
                                                                                             ,
                                II
                                                                                   II
                                                                                               I
                                       II
                  II
                             I
                 s (t −1) = −b s (t) → −b) 时, 有:
                           ,



                                                           I        II

                                            ′       lim  f(s (t −1))− f(s (t −1))   = 1          (A14)
                                           |f (−b)| =
                                                                   II
                                                            I
                                                   s
                                                   II (t−1)→−b  s (t −1)− s (t −1)
                                                   s
                                                   I (t−1)=−b
                            II      I           ′
                    因此, 若  s (t −1) , s (t −1), 必定有  f (η t ) < 1. 可得:

                                                        (∑      )
                                                           t
                                                     lim     f (η i ) = 0                           (A15)
                                                             ′
                                                     t→∞   i=1
                                I
                           II
                 即  t → ∞ 时  s (t)− s (t) = 0.
                                    in
                    上述过程表明      0 < |w | ⩽ 1 时, 任意隐含节点有唯一稳定平衡点, 且稳态输出与初始状态无关. 由于                IRRNN  的
                 输出是隐含状态的线性叠加, 因此可得            IRRNN  有唯一稳定平衡点, 且稳态输出与状态的初始值无关. 证毕.
                             李文艺(1980-), 男, 博士生, 主要研究领域为神                 南静(1992-), 男, 博士生, 主要研究领域为神经
                            经网络, 复杂系统建模.                                 网络, 增量式学习.




                             代伟(1984-), 男, 博士, 教授, 博士生导师, 主要              刘从虎(1981-), 男, 博士, 教授, 主要研究领域
                            研究领域为复杂系统建模, 机器学习.                           为再制造技术, 智能制造.
   176   177   178   179   180   181   182   183   184   185   186