Page 176 - 《软件学报》2025年第12期
P. 176

李梓健 等: 基于隐变量解耦学习的时间序列领域自适应方法                                                    5557


                 内部稀疏的关联结构不变性的假设, 文献             [12,13] 提出的稀疏关联结构对齐模型          (SASA) 首先解决时间序列领域
                 自适应的难题. 此外, Li 等人     [14] 进一步假设时间序列数据的因果机制是不变的, 因此他们提出了基于格兰杰因果
                 结构对齐的半监督时间序列领域自适应模型, 以解决时间序列上的领域自适应问题. 另外一部分学者考虑到时间
                 序列数据在时域上是复杂而难以处理的, 所以他们假设时间序列数据在频域上是简单而容易处理的. 例如, Liu                                等
                 人  [15] 提出了  AdvSKM, 该方法是通过混合谱核网络来对频率差异进行约束, 从而提取领域不变的基特征. 与此相
                 似的是   He 等人  [16] 提出了  RAINCOAT, 此方法通过时间和频率特征对齐来解决特征和标签的变化.
                    除此之外, 还有研究者利用时间序列数据的其他性质解决了基于时序数据的领域自适应问题, 例如                                Furqon 等
                 人  [79] 从时序统计量出发, 考虑了时间序列数据的周期项和趋势项, 并且使用周期项和趋势项交替进行预测, 并不
                 断优化预测结果和序列分解从而分解出变化和不变的信息. Ragab                   等人  [60] 考虑到特征学习和不同领域对齐过程中
                 数据的时间动态性质, 通过利用自监督预训练方法和伪标签方式来提升模型在目标域中的性能, 从而减轻了分布
                 偏移  [80] 对深度模型带来的影响.

                  1.3   深度生成模型的可识别性理论
                    深度生成模型由于其强大的性能和多种的应用场景, 得到了越来越多的青睐. 但是如何为深度生成模型提供
                 更加强大的泛化性和可解释性成为一个难题, 而因果表征学习恰好可以满足这个需求. 所谓因果表征学习, 即通过
                 识别出观测数据背后的隐变量从而刻画隐含因果过程. 其中一种提取因果表征的方法是独立成分分析                                   (indepen-

                 dence component analysis, ICA) [81] . 在独立成分分析中, 隐变量通常被假设为相互独立的, 并且隐变量到观测变量之
                 间的关系是线性的, 而非线性的独立成分分析之所以是困难的是因为在非线性条件下隐变量是难以被识别的.
                    近年来, Khemakhem  等人  [82] 在非线性独立成分分析上得到了突破, 他们证明了在有辅助变量的情况下隐变量
                 是可识别的, 这些辅助变量可以是领域标签、时间序列索引等可观测监督信号. 但是这些方法通常假设隐变量是
                 条件独立的, 并且隐变量的分布服从指数族分布. 最近, Kong               等人  [61] 突破了指数族分布的约束并且利用了非线性
                 独立成分分析, 提出了静态数据下的逐维可识别理论 (component-wise identification). 基于这个理论, Yao            等人  [75]
                 进一步将过去的历史信息作为监督信号, 解决了稳态和非稳态下的隐变量可识别性难题. 另外, Li 等人                              [83] 提出了
                 子空间可识别性并解决了多源领域自适应问题, 相比逐维可识别的                      2n+1  个辅助变量, 该方法只需要      n+1  个监督信
                 号便可以获得相同的可识别性效果. 本文利用逐维可识别性质理论使得领域变化的隐变量可以识别, 并进一步解
                 决了时序数据中的领域自适应难题.

                  2   基于数据生成的目标域联合分布可识别

                  2.1   基于隐变量的数据生成过程
                    考虑到观测变量      (如图片) 通常由低维的隐变量         (如语义信息, 图像风格等) 生成, 研究人员通常在数据建模过
                 程中引入隐变量, 然后将特定的隐变量解耦, 并且用于下游任务中. 例如, Cai 等人                    [18] 和  Li 等人  [13] 在解决领域自适
                 应问题中引入了解耦的领域变化和领域不变的隐变量; Kong                  等人  [61]  进一步为解耦的隐变量提供了可识别性的理
                 论保证; Yao  等人  [75] 则在时间序列建模中引入隐变量. 类似地, 本文在不同领域的时间序列建模中考虑了隐变量,
                 其中包括领域变化的隐变量          (如振幅和上下偏移变量) 和领域不变的隐变量              (如不同的频率变量).
                  2.2   数据生成过程
                    为了证明目标域的联合分布是可识别的, 本文首先介绍基于隐变量的数据生成过程, 该生成过程如图                                 2  所示,
                 其中观测变量     x = {x 1 ,..., x t ,..., x T }  由领域变化的隐变量  z d ∈ R n d   和领域不变的隐变量  z c ∈ R n c   通过一个非线性函
                 数  g  生成, 领域变化隐变量    z d  由领域变量  u  决定, 领域不变隐变量    z c  由于标签类别   决定.
                                                                                y
                    为了更好地理解图       2  所示的数据生成过程, 本文进一步结合图            1  提供一个简单易懂的例子. 例如         x = {x 1 ,...,
                 x t ,..., x T } 表示不同的观测正弦曲线,  z d  表示振幅和上下偏移变量,    z c  表示不同的频率变量. 振幅和上下偏移变量随
                 着不同领域变化而变化, 不同的频率由不同的标签                y 所决定. 本文使用符号及含义如表         1  所示.
   171   172   173   174   175   176   177   178   179   180   181