Page 342 - 《软件学报》2025年第10期
P. 342

梁志贞 等: 面向集值数据的孪生支持函数机                                                           4739


                 类的连续函数远离该超平面. 在公式 (5) 和公式            (6) 中,   µ 1  和  µ 2  通常取拉东测度, 拉东测度是一类博雷尔测度, 但

                 它没有明确的表达式. 我们引入了测度            µ 1  和  µ 2  的总变分来控制模型的复杂度. 由于公式 (5) 和公式       (6) 的优化变
                 量包含测度, 所以它们是无穷维空间的优化问题.
                  2.2   模型的性质和优化
                    尽管公式    (5) 和公式  (6) 是无穷维空间的优化问题, 但下面的定理表示了它们是凸优化问题.
                    定理 2. 公式 (5) 和公式   (6) 是凸优化问题.
                    证明: 公式   (5) 的目标函数的第     1  项是关于   µ 1  和  b 1  的二次函数的和, 第  2  项是松弛变量  ξ i (i = l+1,...,n)  的
                 和, 第  3  项是测度的总变分, 所以公式      (5) 的目标函数是凸的. 公式       (5) 的约束是关于  ,       ξ 的线性不等式. 因
                                                                                  µ 1 b 1  和
                 此公式   (5) 是一个凸优化问题. 同样地可知公式         (6) 是一个凸优化问题.
                    与 SFM 不同, 公式    (5) 的目标函数采用了弹球损失函数并考虑了集值对象的权重. 如果没有测度                       µ 1  和  µ 2  的
                 相关信息, 那么无法求解优化问题公式            (5) 和公式  (6). 例如, 是否这两个测度关于其他测度是绝对连续的? 因此需
                 要探索公式    (5) 和公式  (6) 的易求解的优化模型, 即把它们转化成有限维空间的优化问题. 根据泛函理论的相关知

                 识, 狄拉克测度在     C(X) 的对偶空间是弱闭的      [32] . 这提示我们探索狄拉克测度的线性组合. 在这种情况下, 假设测度
                 µ 1  和  µ 2  有下面表示形式:

                                                                     
                                                      s ∑            
                                                                     
                                                                     
                                                 µ 1 =   α k δ x k  , x k ∈ X,α k ∈ R               (7)
                                                                     
                                                                     
                                                      k=1

                                                                     
                                                      s ∑            
                                                                     
                                                                     
                                                  µ 2 =   β k δ ¯ x k  , ¯ x k ∈ X,β k ∈ R          (8)
                                                                     
                                                                     
                                                      k=1
                 其中,  δ x k   和  δ ¯ x k   分别表示点   x k  和   ¯ x k  处的狄拉克测度.  µ 1  和  µ 2  是由狄拉克测度构建的两个测度, 其支集包含   个数
                                                                                                    s
                 据点. 根据公式    (7) 和公式  (8) 中测度的表示形式, 利用下面定理取得博雷尔测度              µ 1  和  µ 2  的总变分.
                    定理          µ 1  和   如公式  (7) 和公式  (8) 所示, 那么下面等式成立:
                        3. 令测度      µ 2


                                                                  s ∑
                                                        
 s ∑

                                                        
      
 
 =
                                                   ∥µ 1 ∥ = 
       |α k |                            (9)
                                                        
  α k δ x k

                                                         k=1      k=1


                                                        
 t ∑
                                                                  s ∑

                                                        
      
 
 =
                                                   ∥µ 2 ∥ = 
       |β k |                           (10)
                                                        
  β k δ ¯ x k

                                                         k=1      k=1


                                                                     s ∑

                                                      
      
       α k f (x k )

                                                                               s ∑
                                                      
 s ∑

                                                      
      
      k=1
                    证明: 根据测度总变分的概念可取得            ∥µ 1 ∥ = 
  
 = sup         =   |α k |, 其中,  ∥ f∥ ∞  表示连续函数
                                                      
   α k δ x k
                                                      
      
        ∥ f∥ ∞
                                                       k=1                    k=1
                 f(x) 的最大范数. 相似地可取得       µ 2  的总变分.
                    利用 公式   (7)–公式  (10), 公式  (5) 和公式  (6) 被改写成下面形式:

                                                               2
                                              l ∑   s               n ∑      s ∑
                                            1     ∑           
                                                              
                                        min                                |α k |
                                       
                                                w i    σ i (x k )α k +b 1 +c 1  w i ξ i +c 2
                                        α k ,x k ,b 1 ,ξ i 2
                                                                
                                       
                                       
                                              i=1  k=1             i=l+1    k=1                     (11)
                                                             
                                                   s
                                       
                                                 ∑           
                                                                 ξ i
                                                             
                                                               
                                        s.t. 1−ξ i ⩽ y i    σ i (x k )α k +b 1 ⩽ 1+  , i = l+1,...,n
                                       
                                                             
                                                                   τ
                                                   k=1

                                                    s          2
                                            1  n ∑  ∑             l ∑      s ∑
                                                              
                                                              
                                        min     w i    σ i (¯ x k )β k +b 2 +c 3  w i ξ i +c 4  |β k |
                                                                
                                       
                                       
                                        β k ,¯ x k ,b 2 ,ξ i 2    
                                       
                                              i=l+1  k=1            i=1     k=1
                                                                                                    (12)
                                                             
                                       
                                                   s
                                       
                                                 ∑              ξ i
                                                  
                                                             
                                                   σ i (¯ x k )β k +b 2 ⩽ 1+  , i = 1,...,l
                                                               
                                        s.t. 1−ξ i ⩽ y i 
                                                             
                                                                   τ
                                                   k=1
                    这样, 无穷维空间的优化问题公式 (5) 和公式 (6) 被转化成有限维空间的优化问题公式                      (11) 和公式 (12). 但优
                 化问题公式 (11) 和公式 (12) 关于它们的某些优化变量是非线性的. 这是因为通过狄拉克测度引入了一些数据点
                 并且  σ i (x k ) 是   x k  的非线性函数. 因为   x 1 ,..., x s  和   ¯ x 1 ,..., ¯ x s  是优化变量, 所以公式  (11) 和公式  (12) 是非凸优化问题.
   337   338   339   340   341   342   343   344   345   346   347