Page 180 - 《软件学报》2025年第12期
P. 180
李梓健 等: 基于隐变量解耦学习的时间序列领域自适应方法 5561
通过数据增广后的数据, 本文采用基于卷积神经网络的结构进行信息提取, 过程如公式 (18) 所示:
z k = f k (CNN (x),θ k ) (18)
( )
z q = f q CNN (˜x),θ q (19)
([ ] )
ˆ z c ,ˆz d = f m z k ;z q ,θ m (20)
其中, f k 表示原始数据特征提取网络, f q 表示增广数据特征提取网络, f m 用于将混合特征转换成领域变化特征和
领域不变特征; θ k , θ q , θ m 表示网络结构的参数. 本文令 f m 前 n c 维表示 , 其余维度表示 .
ˆ z d
ˆ z c
4.1.2 时序解码器
基于时序编码器获得的隐变量 ˆ z c 和ˆz d , 本文进一步设计出时序解码器用于重构观测变量以保证隐变量 ˆ z c 和ˆz d
中的语义信息没有丢失, 其过程如公式 (21) 所示:
( )
ˆ x = ˆg ˆz c ,ˆz d ;θ g (21)
其中, θ g 表示神经网络参数, ˆ x 表示重构的时序数据.
4.1.3 标签预测器和领域预测器
基于提取到的领域变化和领域不变的隐变量, 本文进一步设计出标签预测器和领域预测器用于估计时间序列
数据的标签和领域标签, 如公式 (22) 和公式 (23) 所示:
ˆ y = C y (ˆz c ;θ c ) (22)
ˆ
d = C d (ˆz d ;θ d ) (23)
其中, C y 和 C d 表示标签分类器和领域分类器, θ c 和θ d 分别表示对应模块的参数.
4.2 正交特征对齐模块不变约束
为了保证 ˆ z c 中包含领域不变的信息, 现有的领域自适应方法通常采用不同的约束方法如生成对抗网络来保证
ˆ z c 的分布一致. 和针对具有固定特征尺度的图片数据不同, 因为不同领域的时间序列数据容易受到由
不同领域中
上下偏移和振幅引起的特征尺度不同带来的影响, 所以采用经典的约束方法对特征进行约束容易导致语义信息的
丢失. 为了解决这个问题, 发现特征矩阵通过奇异值分解 (singular value decomposition) 后可以分解为正交基和奇
异值, 如公式 (24) 所示:
ˆ z c = UΣV (24)
其中, U和V 表示正交基, Σ 表示奇异值. 其中, 奇异值只和特征尺度有关而正交基用于保留语义信息. 因此只需要
约束不同领域的正交基之间的距离即可以提取领域不变的特征. 为限制不同领域的正交基距离, 本文采用了文献 [59]
中使用的主角, 其定义如下:
[
定义 1. 主角 (principal angle). 给定 1 组源域的正交基 B = b ,...,b S ] 和 1 组目标域的正交基 B = b ,...,b ,
]
[
T
S
S
T
T
1 m 1 m
则这两组正交基的主角定义如下:
( ) ⊺ T
b S b
1
α = min arccos
S ↔T 1
1 S T
b S ∈B S ,b T ∈B T
b · b
1 1 1 1
( ) ⊺ T
S
b b
2 2
S ↔T
α = min minarccos
2 S T
b S ∈B S ,b T ∈B T
b · b
2 2 2 2
b S ⊥b S ,b T ⊥b T
2 1 2 1
(25)
...
S
( ) ⊺ T
b b
S ↔T m m
α = min arccos
m S T
b S ∈B S ,b T ∈B T
m m b · b
m m
b S ⊥b S ,...,b S
m 1 m−1
b T ⊥b T ,...,b T
m 1 m−1
[ ]
S ↔T S ↔T S ↔T S ↔T
Θ = α ,α ,...,α
1 2 m
基于以上定义, 本文进一步利用主角进一步限制源域和目标域之间的特征距离, 如公式 (26) 所示:

