Page 178 - 《软件学报》2025年第12期
P. 178
李梓健 等: 基于隐变量解耦学习的时间序列领域自适应方法 5559
( ( ) ( ) ( ))
( ) ∂logp z d,1 |u j ∂logp z d,i |u j ∂logp z d,n d |u j
w z d ,u j = ,..., ,..., (2)
∂z d,1 ∂z d,i ∂z d,n d
那么, 当通过模拟上述数据生成过程, 领域变化隐变量则是子空间可识别的.
(
)
证明: 当模型可以正确模拟图 2 所示的数据生成过程的时候, 有 p x|u = p(ˆx|u). 接着, 本文通过以下推导构建
ˆ z
真实隐变量 z 和估计隐变量 之间的关系.
令 ˆ g : Z → X 表示一个估计的、可逆的生成函数, 于是可得公式 (3):
( ) ( ) ( )
∀u ∈ U, p ˆx|u = p x|u ⇐⇒ p ˆg(ˆz)|u = p(g(z)|u) (3)
于是, 由变量变化定义可进一步得到公式 (4):
( )
( ) ( ) −1 ( ) ( ) ( )
p ˆg(ˆz)|u = p g(z)|u ⇔ p g ◦ ˆg(ˆz)|u J g −1 = p z|u J g −1 ⇔ p h(ˆz)|u = p z|u (4)
−1
其中, h := g ◦ ˆg 表示从真实隐变量到估计隐变量之间的转换函数, J g −1 表示 g −1 的雅各比矩阵的行列式. 因为本
文假设 g −1 和 ˆ g 是可逆的, 所以 J g −1 不等于 0 且 h 是可逆的.
然后由于独立性假设, 本文进一步可得公式 (5)、公式 (6):
n ∏
( ) ( )
p z|u = p z i |u (5)
i=1
n ∏
( ) ( )
p ˆz|u = p ˆz i |u (6)
i=1
然后通过联合公式 (6) 和公式 (3) 可得:
n n
∑ ∑
p(z|u) = p(h(ˆz)|u) ⇐⇒ p(ˆz|u) = p(z|u)|J h −1| ⇐⇒ logp(z i |u)+log|J h −1| = logp(ˆz i |u) (7)
i=1 i=1
其中, |J h −1| 表示 h −1 的雅各比矩阵的行列式.
对于任意的 j ∈ {1,...,n c }, 本文对公式 (7) 关于 ˆ z j 求导然后可进一步得到:
∑ ∂logp(ˆz i |u)
n ∂logp(z i |u) ∂z i ∂log|J h −1|
· + = (8)
i=1 ∂z i ∂ˆz j ∂ˆz j ∂ˆz j
接着本文令 , 通过将 u k 和 u 0 分别代入公式 (8), 并且相减可得到公式 (9):
u = u 0 ,...,u k ,...,u n d
( )
∑ n ∂logp(z i |u k ) ∂logp(z i |u 0 ) ∂z i ∂logp(ˆz i |u k ) ∂logp(ˆz i |u 0 )
− · = − (9)
i=1 ∂z i ∂z i ∂ˆz j ∂ˆz j ∂ˆz j
( ) ( )
∂log p ˆz i |u k ∂log p ˆz i |u 0
由于估计隐变量 ˆ z j 的分布不随着领域变化而变化, 因此可知 − = 0. 此外, 由于对于
∂ˆz i
( ) ∂ˆz i ( )
∂log p z i |u k ∂log p z i |u k ∂log p(z i |u 0 )
任意 i ∈ {1,...,n c }, 不会随着不同领域变化而变化, 因此 = . 因此公式 (9) 可以
∂z i ∂z i ∂z i
进一步写成如下形式:
( ( ) )
n ∑ ∂log p(z i |u 0 )
∂log p z i |u k ∂z i
− · = 0 (10)
∂z i ∂z i ∂ˆz j
i=n c +1
接下来, 根据线性独立假设, 可知由公式 (10) 组成的齐次线性方程组有 n d 个未知数, 且具有唯一解, 即 ∂z i = 0.
∂ˆz j
由于 h(·) 在 Z 上是连续的, 所以它的雅各比矩阵可以写成如下形式:
∂z d
A := B := ∂z d
∂ˆz d ∂ˆz c
J h = (11)
∂z c ∂z c
C := D :=
∂ˆz d ∂ˆz c
∂z i
其中, 对于 = 0 且满足 i ∈ {n c +1,...,n}, j ∈ {1,...,n c } 的时候, 公式 (11) 所示的 B = 0. 由于 h(·) 是可逆的, 所以 J h
∂ˆz j
是满秩矩阵. 结合 B = 0, 则 A 非零, 这意味着对于每一个 z d,i 存在一个 , 使得 z d,i = h(ˆz d ), 因此 z d 是子空间可识别的.
h i

