Page 341 - 《软件学报》2025年第10期
P. 341

4738                                                      软件学报  2025  年第  36  卷第  10  期


                                                      ∫
                                                 ϕ(σ) =  σdµ(x), σ(x) ∈ C(X)                          (2)
                                                        X
                                                                     s ∑
                                                                           ,
                    线性泛函    ϕ 的范数表示为    ∥ ϕ ∥= |µ|(X) =∥ µ ∥, 其中,  |µ|(x) = sup  |µ(A i )| A i  是  X  的一个划分,  i = 1,..., s.
                                                                     i=1
                    利用定理 1 可定义巴拿赫空间的超平面, 超平面由定义 2 给出.
                    定义  2. 巴拿赫空间的超平面具有以下形式:

                                                {       ∫                  }
                                             M = σ ∈ C(x),  σ(x)dµ(x)+b = 0,b ∈ R                     (3)
                                                         X
                    利用定义 1 将每个集值对象         A i  转化成连续函数, 表示为    σ i (x) = σ A i (x). 在这种情况下, 根据集值对象和支持
                 函数的定义可构建一个基于函数表示的训练集, 即为                  {(σ i (x),y i ),i = 1,...,n}. 遵循着最大间隔的思想, 下面优化模
                 型     [28] 被用来处理集值数据.
                                          
                                                          n ∑
                                          
                                          
                                                  ∥µ∥+C
                                                          ξ i
                                           min µ,b,ξ i
                                          
                                          
                                          
                                                        i=1
                                               (∫            )
                                          
                                                                                                     (4)
                                              
                                                  σ i (x)dµ(x)+b ⩾ 1−ξ i ,i = 1, ...,n
                                              y i
                                              
                                          
                                           s.t. 
                                                  X
                                              
                                              
                                              
                                               ξ i ⩾ 0, i = 1,...,n
                 其中,  ∥ µ ∥ 是博雷尔测度  µ(x) 的总变分. 公式 (4) 是巴拿赫空间的凸优化问题. 因为公式             (4) 涉及巴拿赫空间的积
                 分, 所以直接求解公式      (4) 是不可行的. 为了求解优化问题公式 (4), Chen 等人         [28] 将整个空间  R  划分为  s 个不同区
                                                                                         m
                 域, 然后计算每个区域的拉东         (Radon) 测度.
                  2   孪生支持函数机
                    本节首先在巴拿赫空间为集值数据引入超平面学习模型, 它包含两个优化问题. 随后讨论了模型的性质并构
                 建了基于采样策略的优化算法. 最后将支持函数推广到基于核函数的方法.
                  2.1   提出的模型
                    利用支持函数的定义把集值对象             A i (i = 1,...,n)  转化成连续函数  σ i (x) = σ A i (x)(i = 1,...,n), 这形成了连续函
                 数空间. 在这种情况下, 需要对连续函数进行分类. 通常, 设计基于函数的分类算法比设计基于向量的分类算法
                 更具挑战性, 这是因为前者涉及无穷维的函数空间, 并且类与类之间由于连续函数的存在使得边界更复杂. 为了便
                 于描述, 假定前    l 个集值对象来自正类, 其余来自负类. 正像图            1 所示的那样, 有时需要两个超平面拟合两类的连
                                                                                      ∫
                 续函数. 这样我们期望在巴拿赫空间寻找两个非平行的超平面, 这两个超平面表示为                                σ(x)dµ 1 (x)+b 1 = 0 和
                 ∫                                                                     X
                   σ(x)dµ 2 (x)+b 2 = 0. 为此构建了下面优化模型来取得巴拿赫空间的两个非平行的超平面:

                  X
                                           ∑     (∫              ) 2  ∑
                                          1   l                        n
                                    
                                       min                                w i ξ i +c 2 ∥µ 1 ∥
                                               w i  σ i (x)dµ 1 (x)+b 1 +c 1
                                    
                                       µ 1 ,b 1 ,ξ i 2  i=1            i=l+1
                                    
                                                     X
                                                  (∫            )                                     (5)
                                    
                                    
                                                                     ξ i
                                    
                                                    σ i (x)dµ 1 (x)+b 1 ⩽ 1+  , i = l+1,...,n
                                       s.t. 1−ξ i ⩽ y i
                                    
                                                    X                 τ
                                                  (∫              ) 2
                                          1  ∑ n                      ∑ l
                                    
                                    
                                       min                                w i ξ i +c 4 ∥µ 2 ∥
                                                w i  σ i (x)dµ 2 (x)+b 2 +c 3
                                       µ 2 ,b 2 ,ξ i 2  i=l+1           i=1
                                    
                                                     X                                               (6)
                                                 (∫            )
                                    
                                    
                                                                     ξ i
                                    
                                                    σ i (x)dµ 2 (x)+b 2 ⩽ 1+  , i = 1,...,l
                                       s.t. 1−ξ i ⩽ y i
                                                                     τ
                                                    X
                 其中,  c 1 ,c 2 ,c 3 ,c 4  为非负参数,  τ 在区间  (0,1] 内取值,  w i  表示第   个集值对象的权重. 公式 (5) 和公式  (6) 采用了弹
                                                                 i
                 球损失函数    [13,16] . 当  τ 趋向  0  时, 弹球损失函数逼近铰链损失函数. 当  τ = 0 时, 公式  (5) 和公式  (6) 的第  2  个约束变
                                                                       ∫
                                                                         σ(x)dµ 1 (x)+b 1 = 0 并且使得负类的连续
                 成了   ξ i ⩾ 0. 公式 (5) 使得正类的连续函数  σ i (x)(i = 1,...,l) 逼近超平面
                                                                        X          ∫
                                                                                     σ(x)dµ 2 (x)+b 2 = 0, 而正
                 函数   σ i (x)(i = l+1,...,n) 远离这个超平面. 对于公式 (6), 负类的连续函数逼近超平面
                                                                                    X
   336   337   338   339   340   341   342   343   344   345   346