Page 342 - 《软件学报》2025年第10期
P. 342
梁志贞 等: 面向集值数据的孪生支持函数机 4739
类的连续函数远离该超平面. 在公式 (5) 和公式 (6) 中, µ 1 和 µ 2 通常取拉东测度, 拉东测度是一类博雷尔测度, 但
它没有明确的表达式. 我们引入了测度 µ 1 和 µ 2 的总变分来控制模型的复杂度. 由于公式 (5) 和公式 (6) 的优化变
量包含测度, 所以它们是无穷维空间的优化问题.
2.2 模型的性质和优化
尽管公式 (5) 和公式 (6) 是无穷维空间的优化问题, 但下面的定理表示了它们是凸优化问题.
定理 2. 公式 (5) 和公式 (6) 是凸优化问题.
证明: 公式 (5) 的目标函数的第 1 项是关于 µ 1 和 b 1 的二次函数的和, 第 2 项是松弛变量 ξ i (i = l+1,...,n) 的
和, 第 3 项是测度的总变分, 所以公式 (5) 的目标函数是凸的. 公式 (5) 的约束是关于 , ξ 的线性不等式. 因
µ 1 b 1 和
此公式 (5) 是一个凸优化问题. 同样地可知公式 (6) 是一个凸优化问题.
与 SFM 不同, 公式 (5) 的目标函数采用了弹球损失函数并考虑了集值对象的权重. 如果没有测度 µ 1 和 µ 2 的
相关信息, 那么无法求解优化问题公式 (5) 和公式 (6). 例如, 是否这两个测度关于其他测度是绝对连续的? 因此需
要探索公式 (5) 和公式 (6) 的易求解的优化模型, 即把它们转化成有限维空间的优化问题. 根据泛函理论的相关知
识, 狄拉克测度在 C(X) 的对偶空间是弱闭的 [32] . 这提示我们探索狄拉克测度的线性组合. 在这种情况下, 假设测度
µ 1 和 µ 2 有下面表示形式:
s ∑
µ 1 = α k δ x k , x k ∈ X,α k ∈ R (7)
k=1
s ∑
µ 2 = β k δ ¯ x k , ¯ x k ∈ X,β k ∈ R (8)
k=1
其中, δ x k 和 δ ¯ x k 分别表示点 x k 和 ¯ x k 处的狄拉克测度. µ 1 和 µ 2 是由狄拉克测度构建的两个测度, 其支集包含 个数
s
据点. 根据公式 (7) 和公式 (8) 中测度的表示形式, 利用下面定理取得博雷尔测度 µ 1 和 µ 2 的总变分.
定理 µ 1 和 如公式 (7) 和公式 (8) 所示, 那么下面等式成立:
3. 令测度 µ 2
s ∑
s ∑
=
∥µ 1 ∥ =
|α k | (9)
α k δ x k
k=1 k=1
t ∑
s ∑
=
∥µ 2 ∥ =
|β k | (10)
β k δ ¯ x k
k=1 k=1
s ∑
α k f (x k )
s ∑
s ∑
k=1
证明: 根据测度总变分的概念可取得 ∥µ 1 ∥ =
= sup = |α k |, 其中, ∥ f∥ ∞ 表示连续函数
α k δ x k
∥ f∥ ∞
k=1 k=1
f(x) 的最大范数. 相似地可取得 µ 2 的总变分.
利用 公式 (7)–公式 (10), 公式 (5) 和公式 (6) 被改写成下面形式:
2
l ∑ s n ∑ s ∑
1 ∑
min |α k |
w i σ i (x k )α k +b 1 +c 1 w i ξ i +c 2
α k ,x k ,b 1 ,ξ i 2
i=1 k=1 i=l+1 k=1 (11)
s
∑
ξ i
s.t. 1−ξ i ⩽ y i σ i (x k )α k +b 1 ⩽ 1+ , i = l+1,...,n
τ
k=1
s 2
1 n ∑ ∑ l ∑ s ∑
min w i σ i (¯ x k )β k +b 2 +c 3 w i ξ i +c 4 |β k |
β k ,¯ x k ,b 2 ,ξ i 2
i=l+1 k=1 i=1 k=1
(12)
s
∑ ξ i
σ i (¯ x k )β k +b 2 ⩽ 1+ , i = 1,...,l
s.t. 1−ξ i ⩽ y i
τ
k=1
这样, 无穷维空间的优化问题公式 (5) 和公式 (6) 被转化成有限维空间的优化问题公式 (11) 和公式 (12). 但优
化问题公式 (11) 和公式 (12) 关于它们的某些优化变量是非线性的. 这是因为通过狄拉克测度引入了一些数据点
并且 σ i (x k ) 是 x k 的非线性函数. 因为 x 1 ,..., x s 和 ¯ x 1 ,..., ¯ x s 是优化变量, 所以公式 (11) 和公式 (12) 是非凸优化问题.

