Page 142 - 《软件学报》2021年第5期
P. 142

1366                                     Journal of Software  软件学报 Vol.32, No.5,  May 2021

                 所以,
                                      ∂ λ a→  i  =−  xy j (1 tanhλ+  b→  j  )  ⎛  ⎜ ∏  x k  ⎞
                                                  j
                                      ∂  λ  b→  j  2 (x +  j  y j ) (1 tanh λ  2  −  2  a→  i  )  kV a∈  ()\ , i j ⎝  x +  k  y k ⎠  ⎟
                                              y j (1 tanhλ  +  b→  j )(1 tanhλ  +  a→  i  )
                                           =−
                                                        −
                                                             2
                                                (x +  j  y j )(1 tanh λ a→ i )
                                                    +
                                                y  1tanhλ
                                           =−    j        b→  j  ,
                                                    −
                                              x +  j  y j  1tanhλ a→ i
                 因此,
                                          ∂ λ a→ i  =−  y j  1tanhλ+  b→ j
                                         ∂  λ  b→  j  x +  j  y j  1tanhλ  −  a→  i
                                                       +
                                                  y   1tanhλ
                                               =   j        b→  j
                                                       −
                                                x +  y  1tanhλ
                                                 j   j      a→ i
                                                         +
                                                  y     1tanhλ b→
                                              ≤    j            j  (0 <  xy < 1)
                                                                        ,
                                                                          j
                                                                       j
                                                 x +  y  ⎛  x     ⎞
                                                      1−  j  j  ⎜  2  j  − ⎜  1⎟  ⎟
                                                        ⎝  x +  y j  ⎠
                                                           j
                                                       +
                                                  y   1tanhλ
                                               =   j        b→  j
                                                x +  y  j  2  y j
                                                 j
                                                        x +  y
                                                         j   j
                                                1
                                               =  (1 tanhλ b→ j ) 1.
                                                   +
                                                            <
                                                2
                    关于情形 1 和情形 2,公式(21)和公式(25)表明:对于∀λ b→j ∈(−∞,+∞),都有:
                                                        ∂ λ
                                                         a→ i  <  1,
                                                        ∂ λ b→  j
                                                          ∂ λ
                 所以,                                sup λ∈ V  ∂ λ a→ i j  < 1.
                                                            b→
                 注意:λ a→i 和λ b→j 是λ 的分量.
                                                                                  ∂ λ
                    利用函数 f 的雅可比矩阵构造矩阵范数 A,也即 A 中的元素为τ                 a→  , i b→  j  =  sup λ∈  V  ∂ λ a→ i j  .我们给出如下结论.
                                                                                    b→
                    定理 1.  对于 A 1 -范数,如果 max b→  j  a→ i τ a→  , i b→ ∑  j  < 1 成立,那么 BP 算法在 A 1 -范数下能够有效收敛到固定点,
                 且与初始信息无关.
                    证明:根据公式(6)、公式(7)和公式(9),有:
                                     || A =  || || f λ  ′ ( ) || =  max  j ∑  ∂ λ a→ i  ≤ max  j ∑  τ  .
                                        1       1    b→   a→  i  ∂ λ b→ j  b→  a→  i  a→  , i b→  j
                    由压缩映射原理和引理 1 可知:如果 max          b→  j  a→ i τ a→  , i b→ ∑  j  < 1 成立,则 BP 算法在 A 1 -范数下收敛,且与初始信
                 息无关.                                                                                 □
                    同理可得以下定理.
                    定理 2.  对于 A ∞ -范数,如果 max a→  i  b→  j τ a→  , i b→ ∑  j  < 1 成立,则 BP 算法在 A ∞ -范数下收敛到固定点,且与初始
                 信息无关.
                    证明:根据公式(6)、公式(8)和公式(9),有:
                                                               a→
                                    || A || =  ∞  || f λ  ′ ( ) || =  ∞  max a→  i ∑  b→  j  ∂ ∂ λ b→ i j  ≤ max a→  i  b→  j τ  a→  , i b→ ∑  j .
                                                              λ
   137   138   139   140   141   142   143   144   145   146   147