Page 174 - 《软件学报》2025年第12期
P. 174

李梓健 等: 基于隐变量解耦学习的时间序列领域自适应方法                                                    5555


                 variables are partitioned into domain-specific and domain-invariant latent variables. Based on this data generation process, the identifiability
                 of  domain-specific  latent  variables  is  established.  The  DIVV  model,  built  on  this  identification  theory,  disentangles  domain-specific  and
                 domain-invariant  latent  variables  using  variational  influence  and  an  orthogonal  basis  alignment  module.  Finally,  the  DIVV  model  leverages
                 domain-invariant  representations  for  time  series  classification.  Experimental  results  demonstrate  that  the  DIVV  model  outperforms  existing
                 domain adaptation methods for time series data across various benchmark datasets, highlighting its effectiveness in real-world applications.
                 Key words:  transfer learning; time series domain adaptation; time series classification; causal generation process; identifiability

                    针对时间序列数据的领域自适应            [1−3] 旨在利用带标签的源域数据和不带标签的目标域将源域的语义信息迁移
                 到目标域中, 以缓解深度学习模型          [4−8] 在目标域上的分布偏移现象. 具体而言, 本文用           S  和  T  来表示源域和目标域
                                                                                                     S
                                                                                                   S
                 分布, 而且   x = {x 1 ,..., x T }, y, u  分别表示长度为  T  的时间序列, 类别标签以及领域标签. 本文进一步令       (x ,y ) =
                 (  S  )                                                ( )  ( ) m T
                                                                         T
                                                                              T
                  x ,y S m S   表示从源域分布   p(x,y,u S )  采样获得的带标签源域数据, 而令   x  = x   表示从目标域分布       p(x,u T ) 采
                  i  i  i=1                                                   i  i=1
                 样获得的不带标签目标域数据. 基于上述符号定义, 基于时间序列的领域自适应的目标是利用带标签的源域数据
                 和不带标签的目标域数据来识别目标域的联合分布                  p(x,y,u T ).
                    为了识别目标域的联合分布          p(x,y,u T ), 仅利用带标签的源域数据和不带标签的目标域数据来识别目标域的联
                                                                                 p(x,u T ) 有无数种对应关系. 为
                 合分布   p(x,y,u T ) 并非一件容易的事情, 因为在没有其他假设的条件下             p(x,y,u T ) 和
                 了解决这个难题, 不少研究人员采用了不同的假设并且将这些假设应用到针对时间序列数据的领域自适应方法
                                                                                ( )
                 中. 其中最经典的一种假设为协变量偏移假设              [9−11] , 它假设边缘分布是变化的, 即    p x S  , p x T   而条件分布是不变
                                                                                       ( )
                       (  S  S  )  T  T
                 的, 即  p y |x  = p(y |x ). 基于协变量偏移假设, 不少研究人员利用针对时间序列的特征提取器或者进一步假设频
                 域的边缘分布是不变的来提取领域不变信息. 例如                Cai 等人  [12] 及  Li 等人  [13] 提出通过自注意机制提取的跨领域的
                 稀疏关联结构进行对齐. 随后, Li 等人        [14] 提出了用于可转移时间序列预测的格兰杰             (Granger) 因果关系对齐模型,
                 借助格兰杰因果关系的帮助该模型可以同时发现因果结构并预测未来值. Liu                        等人  [15] 使用混合谱网络来最小化时
                 间序列数据的频率差异. 而        He 等人  [16]  通过使用辛克霍恩   (Sinkhorn) 散度约束来对齐时间和频率特征, 以解决特
                 征变化的问题. 总的来说, 这些方法通过限制隐变量联合分布的不变性来减轻分布偏移的影响.
                    尽管这些方法一定程度上缓解了时间序列数据中的分布偏移, 但是它们依然不能识别出目标域的联合分布
                                                                                         ( )   ( )
                                                                                          S
                                                                                                T
                                                                     z
                 p(x,y,u T ), 造成上述情况的根本原因是即使这些方法限制了隐变量   联合分布的不变性, 即                    p z  = p z , 此类方
                 法不能很好地将领域变化隐变量和领域不变隐变量解耦出来. 图                     1  提供了一个简单易懂的例子, 图         1(a) 是源域和
                 目标域时间序列数据, 这些观测数据由频率、振幅和上下偏移                    3  种不同隐变量生成, 其中不同频率决定不同类别,
                 即正类/负类, 振幅和上下偏移随不同领域变化而变化; 图                 1(b) 现有的方法因为领域变化和不变的隐变量发生耦
                 合, 从而导致不准确的预测结果; 图          1(c) 通过解耦领域变化和不变的隐变量, 从而获得良好的预测结果. 如图                   1(a)
                 所示, 不同领域的时间序列数据由频率, 振幅和上下偏移                 3  个隐变量所影响, 其中频率决定了一个时间序列样本的
                 类别, 而振幅和上下偏移是随着领域变化而变化的因素. 如图                   1(b) 所示, 现有基于边缘分布不变性的方法并不能
                 很好地将领域变化和领域不变的特征解耦出来, 从而使得提出的特征依然含有领域变化的部分, 最终导致分类效
                 果不尽人意. 如图     1 (c) 所示, 当领域变化和领域不变的特征被完全地解耦出来, 模型就可以将领域不变的特征用
                 于分类, 从而使模型更好地克服分布偏移的影响, 获得理想的分类效果.
                    基于以上例子, 为了将时间序列数据中领域变化和领域不变的隐变量解耦, 我们假设不同领域的时间序列数
                 据中部分语义信息是稳定不变的, 并且提出了针对时间序列的隐变量解耦学习领域自适应模型                               (time series domain
                 adaptation via disentangling invariant and variant latent variables, DIVV). 为此首先提出一个针对时间序列分类的因
                 果数据生成过程. 在合理的假设下, 进一步证明了领域变化的隐变量是可识别的. 基于上述可识别性理论, 本文进
                 一步设计了基于隐变量解耦学习的时间序列自适应模型, 该模型包括两个组成部分: 1) 基于变分推断的数据生成
                 过程拟合模块; 2) 基于正交特征对齐的不变特征提取模块. 其中, 基于变分推断的数据生成过程拟合模块用于结合
                 可识别性理论, 将领域变化隐变量识别出来. 基于正交特征对齐的不变特征提取模块则通过约束不同领域之间的
                 正交特征不变性使得领域不变特征得以解耦. 所提                DIVV  方法不仅拥有因果可识别性方面的理论优势, 并且在多
                 个时间序列分类领域自适应基准数据集              (UCIHAR、HHAR   和  WISDM) 上获得了最好的实验效果.
   169   170   171   172   173   174   175   176   177   178   179