Page 341 - 《软件学报》2025年第10期
P. 341
4738 软件学报 2025 年第 36 卷第 10 期
∫
ϕ(σ) = σdµ(x), σ(x) ∈ C(X) (2)
X
s ∑
,
线性泛函 ϕ 的范数表示为 ∥ ϕ ∥= |µ|(X) =∥ µ ∥, 其中, |µ|(x) = sup |µ(A i )| A i 是 X 的一个划分, i = 1,..., s.
i=1
利用定理 1 可定义巴拿赫空间的超平面, 超平面由定义 2 给出.
定义 2. 巴拿赫空间的超平面具有以下形式:
{ ∫ }
M = σ ∈ C(x), σ(x)dµ(x)+b = 0,b ∈ R (3)
X
利用定义 1 将每个集值对象 A i 转化成连续函数, 表示为 σ i (x) = σ A i (x). 在这种情况下, 根据集值对象和支持
函数的定义可构建一个基于函数表示的训练集, 即为 {(σ i (x),y i ),i = 1,...,n}. 遵循着最大间隔的思想, 下面优化模
型 [28] 被用来处理集值数据.
n ∑
∥µ∥+C
ξ i
min µ,b,ξ i
i=1
(∫ )
(4)
σ i (x)dµ(x)+b ⩾ 1−ξ i ,i = 1, ...,n
y i
s.t.
X
ξ i ⩾ 0, i = 1,...,n
其中, ∥ µ ∥ 是博雷尔测度 µ(x) 的总变分. 公式 (4) 是巴拿赫空间的凸优化问题. 因为公式 (4) 涉及巴拿赫空间的积
分, 所以直接求解公式 (4) 是不可行的. 为了求解优化问题公式 (4), Chen 等人 [28] 将整个空间 R 划分为 s 个不同区
m
域, 然后计算每个区域的拉东 (Radon) 测度.
2 孪生支持函数机
本节首先在巴拿赫空间为集值数据引入超平面学习模型, 它包含两个优化问题. 随后讨论了模型的性质并构
建了基于采样策略的优化算法. 最后将支持函数推广到基于核函数的方法.
2.1 提出的模型
利用支持函数的定义把集值对象 A i (i = 1,...,n) 转化成连续函数 σ i (x) = σ A i (x)(i = 1,...,n), 这形成了连续函
数空间. 在这种情况下, 需要对连续函数进行分类. 通常, 设计基于函数的分类算法比设计基于向量的分类算法
更具挑战性, 这是因为前者涉及无穷维的函数空间, 并且类与类之间由于连续函数的存在使得边界更复杂. 为了便
于描述, 假定前 l 个集值对象来自正类, 其余来自负类. 正像图 1 所示的那样, 有时需要两个超平面拟合两类的连
∫
续函数. 这样我们期望在巴拿赫空间寻找两个非平行的超平面, 这两个超平面表示为 σ(x)dµ 1 (x)+b 1 = 0 和
∫ X
σ(x)dµ 2 (x)+b 2 = 0. 为此构建了下面优化模型来取得巴拿赫空间的两个非平行的超平面:
X
∑ (∫ ) 2 ∑
1 l n
min w i ξ i +c 2 ∥µ 1 ∥
w i σ i (x)dµ 1 (x)+b 1 +c 1
µ 1 ,b 1 ,ξ i 2 i=1 i=l+1
X
(∫ ) (5)
ξ i
σ i (x)dµ 1 (x)+b 1 ⩽ 1+ , i = l+1,...,n
s.t. 1−ξ i ⩽ y i
X τ
(∫ ) 2
1 ∑ n ∑ l
min w i ξ i +c 4 ∥µ 2 ∥
w i σ i (x)dµ 2 (x)+b 2 +c 3
µ 2 ,b 2 ,ξ i 2 i=l+1 i=1
X (6)
(∫ )
ξ i
σ i (x)dµ 2 (x)+b 2 ⩽ 1+ , i = 1,...,l
s.t. 1−ξ i ⩽ y i
τ
X
其中, c 1 ,c 2 ,c 3 ,c 4 为非负参数, τ 在区间 (0,1] 内取值, w i 表示第 个集值对象的权重. 公式 (5) 和公式 (6) 采用了弹
i
球损失函数 [13,16] . 当 τ 趋向 0 时, 弹球损失函数逼近铰链损失函数. 当 τ = 0 时, 公式 (5) 和公式 (6) 的第 2 个约束变
∫
σ(x)dµ 1 (x)+b 1 = 0 并且使得负类的连续
成了 ξ i ⩾ 0. 公式 (5) 使得正类的连续函数 σ i (x)(i = 1,...,l) 逼近超平面
X ∫
σ(x)dµ 2 (x)+b 2 = 0, 而正
函数 σ i (x)(i = l+1,...,n) 远离这个超平面. 对于公式 (6), 负类的连续函数逼近超平面
X

