Page 178 - 《软件学报》2025年第12期
P. 178

李梓健 等: 基于隐变量解耦学习的时间序列领域自适应方法                                                    5559


                                             (     (   )        (   )        (    ))
                                       (   )  ∂logp z d,1 |u j  ∂logp z d,i |u j  ∂logp z d,n d  |u j
                                     w z d ,u j =       ,...,        ,...,                            (2)
                                                 ∂z d,1        ∂z d,i       ∂z d,n d
                    那么, 当通过模拟上述数据生成过程, 领域变化隐变量则是子空间可识别的.
                                                                       (
                                                                          )
                    证明: 当模型可以正确模拟图          2  所示的数据生成过程的时候, 有        p x|u = p(ˆx|u). 接着, 本文通过以下推导构建
                                      ˆ z
                 真实隐变量    z 和估计隐变量   之间的关系.
                    令  ˆ g : Z → X  表示一个估计的、可逆的生成函数, 于是可得公式          (3):

                                                 (  )  (  )      (    )
                                          ∀u ∈ U, p ˆx|u = p x|u ⇐⇒ p ˆg(ˆz)|u = p(g(z)|u)            (3)
                    于是, 由变量变化定义可进一步得到公式             (4):

                                                   (        )
                                 (    )  (     )    −1           (  )      (  )  (  )
                                p ˆg(ˆz)|u = p g(z)|u ⇔ p g ◦ ˆg(ˆz)|u J g −1 = p z|u J g −1 ⇔ p h(ˆz)|u = p z|u  (4)

                          −1
                 其中,  h := g ◦ ˆg 表示从真实隐变量到估计隐变量之间的转换函数,              J g −1 表示  g −1  的雅各比矩阵的行列式. 因为本




                 文假设  g −1   和   ˆ g 是可逆的, 所以  J g −1 不等于  0  且  h 是可逆的.
                    然后由于独立性假设, 本文进一步可得公式              (5)、公式  (6):

                                                             n ∏
                                                       (  )     (  )
                                                      p z|u =  p z i |u                               (5)
                                                            i=1

                                                             n ∏
                                                       (  )     (  )
                                                      p ˆz|u =  p ˆz i |u                             (6)
                                                            i=1
                    然后通过联合公式       (6) 和公式  (3) 可得:

                                                                  n                   n
                                                               ∑                    ∑
                          p(z|u) = p(h(ˆz)|u) ⇐⇒ p(ˆz|u) = p(z|u)|J h −1| ⇐⇒  logp(z i |u)+log|J h −1| =  logp(ˆz i |u)  (7)
                                                                  i=1                 i=1
                 其中,   |J h −1| 表示  h −1  的雅各比矩阵的行列式.
                    对于任意的     j ∈ {1,...,n c }, 本文对公式  (7) 关于  ˆ z j  求导然后可进一步得到:

                                           ∑                          ∂logp(ˆz i |u)
                                             n ∂logp(z i |u) ∂z i  ∂log|J h −1|
                                                        ·  +        =                                 (8)
                                             i=1  ∂z i   ∂ˆz j  ∂ˆz j    ∂ˆz j
                    接着本文令                   , 通过将   u k  和  u 0  分别代入公式  (8), 并且相减可得到公式  (9):
                              u = u 0 ,...,u k ,...,u n d
                                       (                    )
                                   ∑  n  ∂logp(z i |u k )  ∂logp(z i |u 0 )  ∂z i  ∂logp(ˆz i |u k )  ∂logp(ˆz i |u 0 )
                                                 −           ·   =         −                          (9)
                                      i=1   ∂z i      ∂z i    ∂ˆz j  ∂ˆz j      ∂ˆz j
                                                                         (  )       (   )
                                                                    ∂log p ˆz i |u k  ∂log p ˆz i |u 0
                    由于估计隐变量       ˆ z j  的分布不随着领域变化而变化, 因此可知                 −           = 0. 此外, 由于对于
                                                                                   ∂ˆz i
                                    (  )                                ∂ˆz i (  )
                               ∂log p z i |u k                       ∂log p z i |u k  ∂log p(z i |u 0 )
                 任意  i ∈ {1,...,n c },    不会随着不同领域变化而变化, 因此                    =          . 因此公式  (9) 可以
                                   ∂z i                                  ∂z i       ∂z i
                 进一步写成如下形式:

                                                (     (  )           )
                                              n ∑           ∂log p(z i |u 0 )
                                                 ∂log p z i |u k       ∂z i
                                                          −           ·   = 0                        (10)
                                                     ∂z i      ∂z i    ∂ˆz j
                                             i=n c +1
                    接下来, 根据线性独立假设, 可知由公式           (10) 组成的齐次线性方程组有        n d  个未知数, 且具有唯一解, 即    ∂z i  = 0.
                                                                                                   ∂ˆz j
                 由于  h(·) 在  Z  上是连续的, 所以它的雅各比矩阵可以写成如下形式:

                                                                     
                                                           ∂z d
                                                      A :=    B :=  ∂z d  
                                                     
                                                                     
                                                                     
                                                                     
                                                         ∂ˆz d   ∂ˆz c  
                                                  J h =                                          (11)
                                                                     
                                                                     
                                                          ∂z c    ∂z c 
                                                     
                                                      C :=    D :=    
                                                           ∂ˆz d   ∂ˆz c
                          ∂z i
                 其中, 对于     = 0 且满足  i ∈ {n c +1,...,n}, j ∈ {1,...,n c } 的时候, 公式  (11) 所示的  B = 0. 由于   h(·) 是可逆的, 所以   J h
                          ∂ˆz j
                 是满秩矩阵. 结合    B = 0, 则  A  非零, 这意味着对于每一个    z d,i  存在一个  , 使得  z d,i = h(ˆz d ), 因此  z d  是子空间可识别的.
                                                                      h i
   173   174   175   176   177   178   179   180   181   182   183