Page 349 - 《软件学报》2025年第10期

P. 349

4746 软件学报 2025 年第 36 卷第 10 期

点. 从表 4 可看出, 当存在标签噪声时, 各种方法的性能存在一定程度的下降. 由于 TSFM 采用了样本的权重和弹球
损失函数, TSFM 比其他方法取得更好的分类性能. 这说明 TSFM 能抑制标签噪声.
从表 3 和表 4 可看到在多个数据集上测试了多个分类器. 因此有必要根据它们在多个数据集上的性能对它们
进行总体评价. 已有结果表明, 弗里德曼检验 (Friedman test) 与事后检验 [37] 是评价多种分类模型的有效工具. 对于
弗里德曼检验, 原假设是所有分类器都有相等的秩. 在这个假设下, 可取得弗里德曼统计量, 该统计量为 k −1 自由
χ , 其中, k 是分类器的个数. 弗里德曼检验考虑了分类器的平均秩. 如果两个分类器的平均秩至少存在
2
度的分布 F
√
CD = q α k(k +1)/6N 值的差别 [37] , 则它们性能明显不同, 其中, N 是数据集的个数, q α 是通过统计量取得的数值.
图 4(a) 表示了在 14 个数据集上 7 种方法对比的 CD 图, 图 4(b) 表示了在标签噪声的数据集上各种方法对比的
α = 0.05 的情况下, CD 的值为 2.407. 从图 4 可看出, 由于 TSFM 的平均秩最小, 因此 TSFM 比其
CD 图. 在置信度
他方法取得更好的性能.

CD=2.407 CD=2.407
7 6 5 4 3 2 1 7 6 5 4 3 2 1

SANP TSFM SANP TSFM
RCRC SFM RCRC SFM
UTSVM SMM
UTSVM SMM
SOCP SOCP
(a) 基于表 3 的结果不同方法的对比 (b) 基于表 4 的结果不同方法的对比
图 4 依据 CD 图比较不同方法的性能

3.3 手写体数字集上的实验
本节在 USPS 数据集上测试了 TSFM 的稳健性. 为了生成集值数据, 我们考虑了两种几何变换: 旋转变换和错
切变换. 对每幅 16×16 的手写体数字图像, 从高斯分布 N(40,180) 取得旋转角度 θ, 并从高斯分布 N(1,1) 取得错切
因子 s y . 利用这两种几何变换生成一系列图像. 这些图像相对原图像存在扭曲和变形. 为了测试二元分类任务, 我
们将一些数字形成数字对, 即数字 2 和数字 3, 数字 4 和数字 9 构成数字对. 对每种情况, 从每类中随机抽取 100
幅图像, 然后利用几何变换为每幅图像生成 10, 20, 30 幅图像, 从而构建集值数据. 图 5 表示了几何变换后的一些
图像. 为了生成用于测试的集值数据, 从每类图像中随机选择 100 幅图像, 并采用与训练集相似的策略生成集值数
据. 训练集和测试集中的集值对象包含几何变换的事例, 这些几何变换的事例导致事例的波动范围比较大, 从而可
能产生离群点. 我们取 20 次运行的平均作为实验结果, 并额外执行 5 次来选择各种模型的超参数. 实验结果如
图 6 所示.

(a) 旋转的手写体数字图像 (b) 错切的手写体数字图像
图 5 两种几何变换的手写体数字图像

从图 6 可看出, 随着集值对象包含的图像越多, 各种方法的性能在大多数情况下得到改善. 错切变换比旋转变
换导致更大的错误率. 在这些图像数据上, SMM 的性能并不好于 SFM 的性能, 这是因为 SMM 利用了所有几何变

344 345 346 347 348 349 350 351 352 353 354