Page 344 - 《软件学报》2025年第10期
P. 344

梁志贞 等: 面向集值数据的孪生支持函数机                                                           4741


                                                      ∂L
                                                         = w i u i +γ i = 0                          (18)
                                                      ∂u i

                                          ∂L      n ∑             l ∑
                                             = c 2 −  (¯γ i − ˆγ i )y i σ i (x k )−  σ i (x k )γ i − ¯ θ k = 0  (19)
                                          ∂¯α k
                                                 i=l+1            i=1

                                          ∂L      n ∑             l ∑
                                             = c 2 +  (¯γ i − ˆγ i )y i σ i (x k )+  σ i (x k )γ i − ˆ θ k = 0  (20)
                                          ∂ˆα k
                                                 i=l+1            i=1
                                               ∂L          ˆ γ i
                                                  = w i c 1 − ¯γ i −  = 0, i = l+1,...,n             (21)
                                               ∂ξ i        τ

                                                 ∂L     l ∑  n ∑
                                                    = −  γ i −  (¯γ i − ˆγ i )y i = 0                (22)
                                                 ∂b 1
                                                       i=1  i=l+1
                    从公式   (17)–公式  (22) 可取得公式  (15) 的对偶优化问题, 表示为:

                                                    2
                                             1  l ∑  (γ i )  n ∑
                                    
                                            −        +
                                                         (¯γ i − ˆγ i )y i
                                     max γ i ,¯γ i ,ˆγ i
                                    
                                             2
                                                  w i
                                               i=1    i=l+1
                                    
                                    
                                    
                                    
                                        
                                    
                                               n ∑             l ∑
                                        
                                        
                                         
                                         c 2 −  y i (¯γ i − ˆγ i )σ i (x k )−  γ i σ i (x k ) ⩾ 0, k = 1,..., s
                                        
                                        
                                        
                                    
                                        
                                             i=l+1           i=1
                                        
                                        
                                        
                                                                                                    (23)
                                         
                                              n ∑             l ∑
                                        
                                        
                                          c 2 +
                                        
                                               y i (¯γ i − ˆγ i )σ i (x k )+  γ i σ i (x k ) ⩾ 0, k = 1,..., s
                                    
                                    
                                     s.t. 
                                        
                                              i=l+1           i=1
                                        
                                        
                                        
                                        
                                           l
                                         ∑      n ∑
                                        
                                        
                                        
                                            γ i +  (¯γ i − ˆγ i )y i = 0
                                        
                                        
                                        
                                        
                                         
                                          i=1  i=l+1
                                        
                                        
                                    
                                           τw i c 1 −τ¯γ i − ˆγ i = 0, i = l+1,...,n
                    类似地可取得公式       (14) 的对偶优化问题, 表示为:

                                                   2
                                          1  ∑ n  (η i )  ∑ l
                                    
                                    
                                     max−           +    (¯η i − ˆη i )y i
                                    
                                    
                                     η i ,η i ,ˆη i  2  i=l+1 w i  i=1
                                    
                                        
                                    
                                               l ∑            n ∑
                                        
                                        
                                        
                                         c 4 −  y i (¯η i − ˆη i )σ i (x k )−  η i σ i (x k ) ⩾ 0, k = 1,..., s
                                        
                                        
                                        
                                        
                                             i=1            i=l+1
                                        
                                        
                                        
                                        
                                              l ∑            n ∑
                                                                                                    (24)
                                          c 4 +
                                         
                                        
                                                y i (¯η i − ˆη i )σ i (x k )+  η i σ i (x k ) ⩾ 0, k = 1,..., s
                                        
                                    
                                    
                                     s.t. 
                                             i=1            i=l+1
                                        
                                        
                                        
                                        
                                            n
                                                l ∑
                                          ∑
                                        
                                        
                                            η i +  (¯η i − ˆη i )y i = 0
                                        
                                        
                                        
                                        
                                        
                                          i=l+1  i=1
                                        
                                        
                                           τw i c 3 −τ¯η i − ˆη i = 0, i = 1,...,l
                    公式  (23) 和公式  (24) 是凸优化问题. 它们的约束个数随着采样点的增加而增加. 当采样点比较少时, 可借助
                 公式  (23) 和公式  (24) 取得对偶解. 从公式    (13) 和公式  (14) 可知支持向量取决于采样点, 但非支持向量不影响它
                 们的目标函数. 如果采样点不是支持向量, 则无需考虑此采样点. 当存在大量采样点时, 删除非支持向量的采样点
                 能降低优化模型的复杂度. 因此关键的问题是如何判断哪些采样点是支持向量. 下面的定理给出了答案.
                    定理  4. 假定求解公式                           ,                         x k  满足条件:
                                     (23) 取得最优解   γ i (i = 1,...,l) ¯γ i , ˆγ i (i = l+1,...,n), 如果采样点


                                               n ∑
                                                                l ∑


                                                y i (¯γ i − ˆγ i )σ i (x k )+  γ i σ i (x k ) < c 2  (25)


                                               i=l+1           i=1
                 那么  x k  不是一个支持向量.
                                                                                                  n ∑
                    证明: 从拉格朗日函数 (17) 的定义可知        ¯ θ 和   ˆ θ k  非负的. 从 Karush-Kuhn-Tucker 最优条件可知: 如果  c 2 +  y i (¯γ i −
                                                                                                 i=l+l
                          l ∑              n ∑             l ∑
                 ˆ γ i )σ i (x k )−  γ i σ i (x k ) > 0  和   c 2 +  y i (¯γ i − ˆγ i )σ i (x k )+  γ i σ i (x k ) > 0, 那么从公式  (19) 和公式  (20) 知   ¯ θ , 0  和
                          i=1             i=l+l            i=1
   339   340   341   342   343   344   345   346   347   348   349