Page 344 - 《软件学报》2025年第10期
P. 344
梁志贞 等: 面向集值数据的孪生支持函数机 4741
∂L
= w i u i +γ i = 0 (18)
∂u i
∂L n ∑ l ∑
= c 2 − (¯γ i − ˆγ i )y i σ i (x k )− σ i (x k )γ i − ¯ θ k = 0 (19)
∂¯α k
i=l+1 i=1
∂L n ∑ l ∑
= c 2 + (¯γ i − ˆγ i )y i σ i (x k )+ σ i (x k )γ i − ˆ θ k = 0 (20)
∂ˆα k
i=l+1 i=1
∂L ˆ γ i
= w i c 1 − ¯γ i − = 0, i = l+1,...,n (21)
∂ξ i τ
∂L l ∑ n ∑
= − γ i − (¯γ i − ˆγ i )y i = 0 (22)
∂b 1
i=1 i=l+1
从公式 (17)–公式 (22) 可取得公式 (15) 的对偶优化问题, 表示为:
2
1 l ∑ (γ i ) n ∑
− +
(¯γ i − ˆγ i )y i
max γ i ,¯γ i ,ˆγ i
2
w i
i=1 i=l+1
n ∑ l ∑
c 2 − y i (¯γ i − ˆγ i )σ i (x k )− γ i σ i (x k ) ⩾ 0, k = 1,..., s
i=l+1 i=1
(23)
n ∑ l ∑
c 2 +
y i (¯γ i − ˆγ i )σ i (x k )+ γ i σ i (x k ) ⩾ 0, k = 1,..., s
s.t.
i=l+1 i=1
l
∑ n ∑
γ i + (¯γ i − ˆγ i )y i = 0
i=1 i=l+1
τw i c 1 −τ¯γ i − ˆγ i = 0, i = l+1,...,n
类似地可取得公式 (14) 的对偶优化问题, 表示为:
2
1 ∑ n (η i ) ∑ l
max− + (¯η i − ˆη i )y i
η i ,η i ,ˆη i 2 i=l+1 w i i=1
l ∑ n ∑
c 4 − y i (¯η i − ˆη i )σ i (x k )− η i σ i (x k ) ⩾ 0, k = 1,..., s
i=1 i=l+1
l ∑ n ∑
(24)
c 4 +
y i (¯η i − ˆη i )σ i (x k )+ η i σ i (x k ) ⩾ 0, k = 1,..., s
s.t.
i=1 i=l+1
n
l ∑
∑
η i + (¯η i − ˆη i )y i = 0
i=l+1 i=1
τw i c 3 −τ¯η i − ˆη i = 0, i = 1,...,l
公式 (23) 和公式 (24) 是凸优化问题. 它们的约束个数随着采样点的增加而增加. 当采样点比较少时, 可借助
公式 (23) 和公式 (24) 取得对偶解. 从公式 (13) 和公式 (14) 可知支持向量取决于采样点, 但非支持向量不影响它
们的目标函数. 如果采样点不是支持向量, 则无需考虑此采样点. 当存在大量采样点时, 删除非支持向量的采样点
能降低优化模型的复杂度. 因此关键的问题是如何判断哪些采样点是支持向量. 下面的定理给出了答案.
定理 4. 假定求解公式 , x k 满足条件:
(23) 取得最优解 γ i (i = 1,...,l) ¯γ i , ˆγ i (i = l+1,...,n), 如果采样点
n ∑
l ∑
y i (¯γ i − ˆγ i )σ i (x k )+ γ i σ i (x k ) < c 2 (25)
i=l+1 i=1
那么 x k 不是一个支持向量.
n ∑
证明: 从拉格朗日函数 (17) 的定义可知 ¯ θ 和 ˆ θ k 非负的. 从 Karush-Kuhn-Tucker 最优条件可知: 如果 c 2 + y i (¯γ i −
i=l+l
l ∑ n ∑ l ∑
ˆ γ i )σ i (x k )− γ i σ i (x k ) > 0 和 c 2 + y i (¯γ i − ˆγ i )σ i (x k )+ γ i σ i (x k ) > 0, 那么从公式 (19) 和公式 (20) 知 ¯ θ , 0 和
i=1 i=l+l i=1

