Page 351 - 《软件学报》2025年第10期

P. 351

4748 软件学报 2025 年第 36 卷第 10 期

SFM 和 TSFM 借助支持函数来选择有效的特征表示. 实验结果表明了对图像的深度特征进行集值对象的建模以
及采用两个非平行的超平面分类图像是合理的.

表 5 在医学图像数据集上的实验结果 (%)

数据集 SANP RCRC SOCP SFM SMM UTSVM TSFM
Breast 22.59±5.42 21.76±7.32 21.33±4.09 20.25±6.03 21.2±6.42 21.50±6.49 19.6±5.46
Pneumonia 8.52±3.88 7.32±3.25 7.15±3.02 6.37±2.89 6.65±3.21 7.28±3.02 6.03±2.05
Nodule 25.33±2.67 26.22±3.25 24.22±3.13 24.52±3.26 23.5±4.05 24.62±3.29 22.4±3.12
Synapse 20.45±4.82 19.55±5.02 17.52±4.85 17.26±4.92 16.8±4.92 19.28±4.56 16.1±5.35

3.5 模型超参数的敏感度分析
TSFM 包含多个待确定的超参数. 与 TSVM 的超参数相类似, TSFM 的超参数将影响模型的性能. 当 TSFM 采
用高斯核函数时, 核超参数 σ 会影响原数据的嵌入空间. 本节在 svmguide 数据集上进行了实验, 通过实验研究
TSFM 的超参数对其性能的影响. 该数据集由 3 089 个样本构成, 其中每个样本包含 4 个属性值和 1 个标签. 为了
测试 TSFM 的超参数对其性能的影响, 随机选择一半的样本来训练 TSFM, 其余的样本用作测试集. 与 UCI 实验
部分生成集值数据相类似, 利用均匀分布生成集值数据. 每个集值对象由 10 个事例组成. 为了在三维空间中可视
c 2 对模型的影响. 实验结果如图 7 所示, 实验结果
化实验结果, 首先通过固定 σ = 1 和 τ = 0.5 来研究超参数 c 1 和
为 TSFM 的错误率, α 的非 0 元素的个数和 TSFM 的运行时间. 从图 7(a) 可看出, TSFM 的分类性能随超参数 c 1
c 2 取较小的值时, TSFM 会取得较低的错误率. 从图 7(b) 可看出, α 的稀疏性受
和 c 2 的变化而变化. 当超参数 c 1 和
到超参数 c 1 和 c 2 的影响. 当 c 1 取较大值时, 模型有更少的支持向量. 在这种情况下, TSFM 的错误率非常高. 从图 7(c)
可观测到当 c 1 取较大值时和 c 2 取较小值时, 训练 TSFM 花费了较多的时间.
τ 对模型的影响. 图 8 表示了 TSFM 的实验结果, 实验结
接下来通过固定 c 1 = 1 和 c 2 = 100 来研究超参数 σ 和
果为 TSFM 的错误率, α 中的非 0 元素的个数和 TSFM 的运行时间. 从图 8(a) 可看出, 超参数 σ 和 τ 会影响 TSFM
σ 取太小的值, 则很难区分嵌入空间的样本, 这是因为嵌入空间的样本是相似的. 当超参
的分类性能. 如果超参数
数 σ 取太大值时, 很难挖掘样本之间的关系, 这是因为变换后的样本几乎是不相关的. 从图 8(a) 可知, 这两种情况
导致了大的错误率. 从图 8(b) 可看出, α 的非 0 元素的个数随着 σ 和 τ 的变化而变化. 超参数 σ 取较小值会产生较
多的支持向量. 从图 8(c) 可看出, TSFM 的运行时间受到超参数 σ 的影响. 当 σ 取较小值和 τ 为非 0 时, TSFM 一
般需要更长的运行时间. 总的来说, 为了获得更好的分类结果, 应该注意超参数的选择问题, 通常对所有超参数的
一系列值进行交叉验证从而选取对应良好性能的超参数.

50 1 000
40 800
错误率 (%) 30 α中的非 0 元素个数 600

400
20
10 200
0 0
−3 −3
−2 −2
−1 3 −1 3
0 2 0 2
1 1 log 10 (c 2 ) 1 1
2 −1 0 2 −1 0
log 10 (c 2 )
3 −2 log 10 (c 1 ) 3 −3 −2 log 10 (c 1 )
−3
(a) TSFM 的错误率 (b) α 中非 0 元素的个数
图 7 TSFM 的超参数 c 1 和 c 2 的敏感度分析

346 347 348 349 350 351 352 353 354 355 356