Page 343 - 《软件学报》2025年第10期
P. 343

4740                                                      软件学报  2025  年第  36  卷第  10  期


                 如果  x 1 ,..., x s  是已知的, 那么公式  (11) 仅包含优化变量  (α k ,b 1 ,ξ i ). 为了有效地求解公式  (11) 和公式  (12), 需要探

                 索   X 中的适当离散点. 不同于求解 SFM 的算法, 本文利用采样策略取得                x 1 ,..., x s  和  ¯ x 1 ,..., ¯ x s . 常用的采样方式是
                                           s
                 从集值对象    A i (i = 1,...,n) 中采样   个数据点. 在后面的实验部分, 通过实验验证了这种采样策略可取得令人满意
                                                                             s
                 的结果. 因为   α 和  β 采用了 L1 范数的约束, 所以    α 和  β 中的元素是稀疏的. 当   个采样点给定时, 本文采用下面的
                 优化问题取得巴拿赫空间的超平面:

                                                   s          2
                                           1  l ∑  ∑              n ∑     s ∑
                                                             
                                                             
                                        min    w i    σ i (x k )α k +b 1 +c 1  w i ξ i +c 2  |α k |
                                                               
                                       
                                       
                                        α k ,b 1 ,ξ i 2      
                                       
                                             i=1  k=1              i=l+1    k=1
                                                                                                    (13)
                                                             
                                       
                                                   s
                                       
                                                  ∑               ξ i
                                                             
                                                    σ i (x k )α k +b 1 ⩽ 1+  , i = l+1,...,n
                                                               
                                        s.t. 1−ξ i ⩽ y i 
                                                             
                                                                    τ
                                                    k=1

                                        
                                                               2
                                              n ∑  s                l ∑     s ∑
                                            1    ∑           
                                                             
                                         min                              |β k |
                                        
                                                w i   σ i (¯ x k )β k +b 2 +c 3  w i ξ i +c 4
                                         β k ,b 2 ,ξ i 2     
                                        
                                        
                                             i=l+1  k=1            i=1      k=1
                                                                                                     (14)
                                        
                                                             
                                        
                                                   s
                                                  ∑          
                                                                    ξ i
                                                             
                                                    σ i (¯ x k )β k +b 2 ⩽ 1+  , i = 1,...,l
                                                               
                                         s.t. 1−ξ i ⩽ y i    
                                        
                                                             
                                                                    τ
                                                    k=1
                    从公式   (13) 和公式  (14) 可知它们是凸优化模型. 如果        α k , 0, 将相应的采样点  x k  称为公式  (13) 的支持向量.
                 如果   β k , 0, 将相应的采样点   ¯ x k  称为公式  (14) 的支持向量. 与 TSVM 不同, TSFM 的支持向量取决于采样点. 由于
                 公式  (13) 和公式  (14) 有相似的形式, 下面主要讨论公式         (13) 的优化问题. 为了处理公式      (13) 中的绝对值符号, 这
                 里引入了非负优化变量        ¯ α k  和   ˆ α k . 设   ¯ α k + ˆα k = |α k | 和   ¯ α k − ˆα k = α k , 其中,   ¯ α k ⩾ 0, ˆα k ⩾ 0, k = 1,..., s. 这样公式  (13) 被转
                 化成下面形式:

                                                s              2
                                        1  l ∑  ∑                  n ∑     s ∑
                                                              
                                                              
                                    min     w i    σ i (x k )(¯α k − ˆα k )+b 1 +c 1  w i ξ i +c 2  (¯α k + ˆα k )
                                   
                                                                
                                    ¯α k ,ˆα k ,b 1 ,ξ i 2    
                                   
                                   
                                          i=1  k=1                  i=l+1    k=1
                                                                                                    (15)
                                   
                                               s             
                                   
                                             ∑               
                                                                  ξ i
                                                             
                                               σ i (x k )(¯α k − ˆα k )+b 1 ⩽ 1+  , i = l+1,...,n
                                                               
                                    s.t. 1−ξ i ⩽ y i 
                                                             
                                                                    τ
                                               k=1
                    公式 (15) 是一个二次规划问题. 利用二次规划的优化算法可求解凸优化问题公式 (15). 对于凸优化问题, 可通
                 过探索对偶解来验证原问题解的最优性, 这需要推导出 公式                   (15) 的对偶形式. 首先公式     (15) 被转化成下面形式:

                                              l ∑       n ∑      s ∑
                                           1
                                                   2
                                      min      w i (u i ) +c 1  w i ξ i +c 2  (¯α k + ˆα k )
                                     
                                     
                                      ¯α k ,ˆα k ,b 1 ,ξ i ,u i 2
                                     
                                     
                                             i=1       i=l+1    k=1
                                     
                                     
                                     
                                     
                                     
                                        
                                             s ∑
                                        
                                        
                                        u i =
                                         
                                               σ i (x k )(¯α k − ˆα k )+b 1
                                        
                                        
                                        
                                                                                                    (16)
                                            k=1
                                         
                                        
                                        
                                        
                                                               
                                                 s
                                     
                                                 ∑               
                                                                     ξ i
                                      s.t. 
                                                               
                                        1        σ i (x k )(¯α k − ˆα k )+b 1 ⩽ 1+  , i = l+1,...,n
                                                                  
                                          −ξ i ⩽ y i 
                                     
                                                               
                                                                      τ
                                        
                                                k=1
                                        
                                        
                                        
                                        
                                        
                                        
                                         ¯ α k ⩾ 0, ˆα k ⩾ 0
                    根据公式    (16) 定义下面的拉格朗日函数:

                                                                               s              
                                   1  l ∑       n ∑      s ∑        n ∑     ∑                
                                            2
                                                                              
                                                                                                
                                                                       
                     L(¯α k , ˆα k ,b 1 ,ξ i ,u i ) =  w i (u i ) +c 1  w i ξ i +c 2  (¯α k + ˆα k )+  ¯ γ i 1−ξ i −y i     σ i (x k )(¯α k − ˆα k )+b 1
                                                                                                
                                                                       
                                                                                                
                                   2                                                          
                                     i=1        i=l+1    k=1       i=l+1       k=1
                                                                            
                                                    n      s                         s
                                 s ∑                                                        s ∑
                                                  ∑    ∑                      ∑
                         l ∑ 
                                                                           ξ i 
                       +   γ i u i −  σ i (x k )(¯α k − ˆα k )+b 1+  ˆ γ i y i   σ i (x k )(¯α k − ˆα k )+b 1−1−    −  ˆ θ k ˆα k −  ¯ θ k ¯α k  (17)
                                                                           
                                                        
                                                 
                             
                                                 
                             
                                                                           
                                                        
                                                                                 
                                                                           τ  
                         i=1     k=1               i=l+1   k=1                      k=1    k=1
                               ,  ,
                                               ,
                 其中,  γ i (i = 1,...,l) ¯γ i ˆγ i (i = l+1,...,n) ¯ θ, ˆ θ k (k = 1,..., s) 是拉格朗日乘子. 将公式  (17) 的拉格朗日函数关于  ¯ α k , ˆα k ,
                 ξ i ,u i  和  b 1  的导数设定为  0, 那么可取得:
   338   339   340   341   342   343   344   345   346   347   348