Page 342 - 《软件学报》2025年第10期

P. 342

梁志贞等: 面向集值数据的孪生支持函数机 4739

类的连续函数远离该超平面. 在公式 (5) 和公式 (6) 中, µ 1 和 µ 2 通常取拉东测度, 拉东测度是一类博雷尔测度, 但

它没有明确的表达式. 我们引入了测度 µ 1 和 µ 2 的总变分来控制模型的复杂度. 由于公式 (5) 和公式 (6) 的优化变
量包含测度, 所以它们是无穷维空间的优化问题.
2.2 模型的性质和优化
尽管公式 (5) 和公式 (6) 是无穷维空间的优化问题, 但下面的定理表示了它们是凸优化问题.
定理 2. 公式 (5) 和公式 (6) 是凸优化问题.
证明: 公式 (5) 的目标函数的第 1 项是关于 µ 1 和 b 1 的二次函数的和, 第 2 项是松弛变量 ξ i (i = l+1,...,n) 的
和, 第 3 项是测度的总变分, 所以公式 (5) 的目标函数是凸的. 公式 (5) 的约束是关于 , ξ 的线性不等式. 因
µ 1 b 1 和
此公式 (5) 是一个凸优化问题. 同样地可知公式 (6) 是一个凸优化问题.
与 SFM 不同, 公式 (5) 的目标函数采用了弹球损失函数并考虑了集值对象的权重. 如果没有测度 µ 1 和 µ 2 的
相关信息, 那么无法求解优化问题公式 (5) 和公式 (6). 例如, 是否这两个测度关于其他测度是绝对连续的? 因此需
要探索公式 (5) 和公式 (6) 的易求解的优化模型, 即把它们转化成有限维空间的优化问题. 根据泛函理论的相关知

识, 狄拉克测度在 C(X) 的对偶空间是弱闭的 [32] . 这提示我们探索狄拉克测度的线性组合. 在这种情况下, 假设测度
µ 1 和 µ 2 有下面表示形式:

 
 s ∑ 
 
 
µ 1 =  α k δ x k , x k ∈ X,α k ∈ R (7)
 
 
k=1

 
 s ∑ 
 
 
µ 2 =  β k δ ¯ x k , ¯ x k ∈ X,β k ∈ R (8)
 
 
k=1
其中, δ x k 和 δ ¯ x k 分别表示点 x k 和 ¯ x k 处的狄拉克测度. µ 1 和 µ 2 是由狄拉克测度构建的两个测度, 其支集包含个数
s
据点. 根据公式 (7) 和公式 (8) 中测度的表示形式, 利用下面定理取得博雷尔测度 µ 1 和 µ 2 的总变分.
定理 µ 1 和如公式 (7) 和公式 (8) 所示, 那么下面等式成立:
3. 令测度 µ 2

s ∑

=
∥µ 1 ∥ =
|α k | (9)

α k δ x k

k=1 k=1

t ∑
s ∑

=
∥µ 2 ∥ =
|β k | (10)

β k δ ¯ x k

k=1 k=1

s ∑

α k f (x k )

s ∑

k=1
证明: 根据测度总变分的概念可取得 ∥µ 1 ∥ =

= sup = |α k |, 其中, ∥ f∥ ∞ 表示连续函数

α k δ x k

∥ f∥ ∞
k=1 k=1
f(x) 的最大范数. 相似地可取得 µ 2 的总变分.
利用公式 (7)–公式 (10), 公式 (5) 和公式 (6) 被改写成下面形式:

   2
 l ∑ s n ∑ s ∑
 1 ∑ 
  
 min     |α k |

 w i   σ i (x k )α k +b 1 +c 1 w i ξ i +c 2
 α k ,x k ,b 1 ,ξ i 2



 i=1 k=1 i=l+1 k=1 (11)
  
 s

 ∑ 
   ξ i
  

 s.t. 1−ξ i ⩽ y i   σ i (x k )α k +b 1 ⩽ 1+ , i = l+1,...,n

  
 τ
k=1

  s  2
 1 n ∑ ∑  l ∑ s ∑
  
  
 min w i   σ i (¯ x k )β k +b 2 +c 3 w i ξ i +c 4 |β k |



 β k ,¯ x k ,b 2 ,ξ i 2  

 i=l+1 k=1 i=1 k=1
 (12)
  

 s

 ∑   ξ i

  
  σ i (¯ x k )β k +b 2 ⩽ 1+ , i = 1,...,l

 s.t. 1−ξ i ⩽ y i 
  
 τ
k=1
这样, 无穷维空间的优化问题公式 (5) 和公式 (6) 被转化成有限维空间的优化问题公式 (11) 和公式 (12). 但优
化问题公式 (11) 和公式 (12) 关于它们的某些优化变量是非线性的. 这是因为通过狄拉克测度引入了一些数据点
并且 σ i (x k ) 是 x k 的非线性函数. 因为 x 1 ,..., x s 和 ¯ x 1 ,..., ¯ x s 是优化变量, 所以公式 (11) 和公式 (12) 是非凸优化问题.

337 338 339 340 341 342 343 344 345 346 347