Page 177 - 《软件学报》2025年第12期
P. 177

5558                                                      软件学报  2025  年第  36  卷第  12  期



                                                                          表 1 符号和对应描述
                               u            y
                                                                  Symbol              Meaning
                                                                   x,y        多维时间序列变量和对应的标签
                                                                    X            多维时间序列变量集合
                               z d          z c
                                                                    z c             领域不变隐变量
                                                                   z d              领域变化隐变量
                                     x                              u                   领域
                                                                   S,T               源域, 目标域
                        图 2    时间序列数据的因果生成过程                        T               时间序列长度
                                                                    n                隐变量维度
                                                                   L(·)               损失函数
                                                                    ∂                   偏导
                                                                    R                  自然数
                                                                   ∏
                                                                                      连乘操作
                                                                    ∑
                                                                                      连加操作
                  2.3   目标域联合分布的可识别性
                    基于第   2.1 节数据生成过程, 本节将展示如何恢复目标域的联合分布                 p(x,y,u T ). 通过引入领域变化的隐变量     z d

                 和领域不变的隐变量       z c , 可得以下公式:

                                       ∫                   ∫
                              p(x,y,u T ) =  p(x,y,u T ,z c ,z d )dz c dz d =  p(x|z c ,z d ) p(y|z c ) p(u T |z d ) p(z d ) p(z c )dz c dz d  (1)
                    由公式   (1) 可知, 为了识别目标域的联合分布         p(x,y,u T ), 需要识别以下几个分布.
                               (    )
                    1) 条件分布   p x|z c ,z d , 该分布表示隐变量到观测变量的重构过程, 可以通过最小化观测变量                x 的重构误差恢
                 复这个分布.
                               (  )
                    2) 条件分布   p y|z c , 该分布表示通过领域不变隐变量        z c  重构标签  y, 可以通过一个分类器并且最小化分类器
                 误差来实现.
                               (   )
                    3) 条件分布   p u T |z d , 该分布表示领域变化的隐变量  , 领域标签       u 的条件分布, 可以通过一个分类器并且最
                                                             z d
                 小化分类器误差来实现.
                    4)   p(z c ) 和   p(z d ), 这两个分布分别表示领域不变的隐变量   z c  和变化的隐变量  z d  的先验分布. 本文假设该先验
                 分布为高斯分布, 并且通过基对齐模块使得该隐变量得以恢复来识别                         p(z c ), 并且通过领域标签分类器来识别
                 p(z d ).

                  3   领域变化隐变量的可识别性理论分析

                                                                                               n
                    在本节, 我们将介绍如何利用领域标签使得领域变化的隐变量                   z d  可识别. 为方便阐述, 本文先令   z ∈ R , z = {z d ,z c },
                                          {  } n c  {  } n
                 且   n = n c +n d . 本文进一步令   z c = z c,i i=1 ,  z d = z d,i i=n c +1  , 且令  g : Z → X  表示一个由隐变量到观测变量的可逆平滑函
                                                                                               n d
                 数. 所谓子空间可识别, 则是对于每一个真实的隐变量                z d  和估计的隐变量  , 存在一个可逆函数        h : R → R, 使得
                                                                          ˆ z d
                 z d = h(ˆz d ) 成立. 基于以上定义, 本文给出以下领域变化隐变量的可识别理论.
                    定理  1. 领域变化隐变量的子空间可识别性.
                    本文遵循图     2  所示的数据生成过程, 并做出以下假设.
                    1) 光滑且恒为正的概率密度假设: 隐变量的概率密度函数是光滑且恒为正的, 即对于任意取值的                        z 和   u, 有   p(z|u)>0.
                                                                                                   (  )
                    2) 条件独立性假设: 给定领域标签        u 的条件下, 对于   i, j ∈ {1,...,n}, 每一维  z i  独立于任意一维度  , 即  log p z|u =
                                                                                            z j
                 ∑
                    p(z i |u).
                                                                                              )
                                                                                          (
                                                    n d                                 w z d ,u j −w(z d ,u 0 ) 是
                    3) 线性独立假设: 对于任意的        z d ∈ Z d ⊆ R , 存在  n d +1 个不同的领域标签使得  n d  个向量
                                             (   )
                 线性独立的, 其中     j ∈ {1,...,n d }, 且  w z d ,u j  的定义如下所示:
   172   173   174   175   176   177   178   179   180   181   182