Page 344 - 《软件学报》2024年第6期
P. 344
2920 软件学报 2024 年第 35 卷第 6 期
3.4 实验数据的统计分析
为了验证实验模型在分类性能上的显著性差异, 我们采用了 Friedman 排序检验和 Holm 事后检验 [36] , 并设置
显著性水平 α=0.05. 如表 5 所示, Friedman 检验的 p-values=0.000772<0.05, 这说明各模型有显著差异. 因此, 接下
来用 Holm 事后检验对 FA-RVFLNN 和其他模型进行比较, 如果 p 值小于 Holm 值, 则拒绝零假设 (两个模型无明
显差异). 由表 6 知 FA-RVFLNN 的分类性能好于 RVFLNN, 与 RVFLNN(C)、BL-DFIS 无明显差异.
表 5 FA-RVFLNN 与 RVFLNN(C)、RVFLNN、BL-DFIS 在分类准确率上的 Friedman 排序检验
Models RVFLNN(C) RVFLNN BL-DFIS FA-RVFLNN
Accuracy ranking 2.4 3.36 2.28 1.96
p-value 0.000 772
表 6 FA-RVFLNN 与 RVFLNN(C)、RVFLNN、BL-DFIS 在分类准确率上的 Holm 事后检验, α=0.05
i Model z p Holm=α/i Hypothesis
RVFLNN
3 RVFLNN 3.834 057 0.000 126 0.016 667 Rejected
2 RVFLNN(C) 1.204 990 0.228 207 0.025 Not rejected
1 BL-DFIS 0.876 356 0.380 836 0.05 Not rejected
最后, 我们用 Wilcoxon 符号秩检验 [36] 来验证 FA-RVFLNN 和其他模型, 在准确率、增强节点数或模糊规则
数上是否无显著差异 (零假设), 设显著性水平 α=0.05. 由表 7 可知, 对于增强节点数 (S), FA-RVFLNN 与 RVFLNN(C)、
RVFLNN 的 p 值分别为 1.788E–07 和 5.960E–08, 都远小于 0.05. FA-RVFLNN 与 BL-DFIS 关于模糊规则数
(#Rules) 检验的 p 值为 0.000 141<0.05. 这表示 FA-RVFLNN 与 BL-DFIS、RVFLNN 在模糊规则数和增强节点数
上有明显差异. 对准确率来说, Wilcoxon 检验与 Friedman、Holm 检验的结论一致. 以上的实验可说明: FA-RVFLNN
能在分类准确率与 BL-DFIS、RVFLNN(C) 相近的情况下, 使用更少的模糊规则和增强节点.
表 7 Wilcoxon 符号秩检验的 p 值, α=0.05
RVFLNN(C) RVFLNN BL-DFIS
Model
Accuracy S Accuracy S Accuracy #Rules
FA-RVFLNN 0.578 206 1.788E–07 4.542E–05 5.960E–08 0.512 821 0.000 141
4 总 结
本文是将 BLS 作为 RVFLNN 特征扩展的一次尝试, 提出的 FA-RVFLNN 是一种兼顾分类性能和可解释性的
模糊神经网络, 它的分类过程可用两组 IF-THEN 规则进行描述. 从实验结果的统计分析可知, 单独分离出的主体
结构 RVFLNN 所具有的泛化性能低于 FA-RVFLNN, 这符合 FA-RVFLNN 用 BL-DFIS 作为性能补充 (或特征扩
展) 的目的. 虽然通过岭回归求解权值的 RVFLNN(C) 在实验条件下, 能达到与使用 SVD 方法的 FA-RVFLNN、
BL-DFIS 相近的泛化性能. 但是 RVFLNN(C) 使用了大量的增强节点 (规则爆炸), 并且 BL-DFIS 也使用了较多的
模糊规则 (根据含义不明确的特征节点进行推理和决策), 这使得后两者的可解释性都较弱. 而本文提出的 FA-
既减缓了主体结构 RVFLNN 的“规则爆炸”问题, 也提高了其性能补充结构 BL-DFIS 的可解释性. FA-
RVFLNN 还是一种适应性较强的模型, 它依次利用结构中的直接连接、增强节点、特征节点、模糊节点, 改变自
身的特征表达能力, 进而灵活地应对复杂程度不同的分类问题. 此外, 在实验过程中, 为了控制变量, FA-RVFLNN
并未在给定的参数范围内搜索其最优超参数 (M、C 等), 而是将这些参数与 BL-DFIS 保持一致. 即便如此, 与先进
的模糊神经模型 BL-DFIS 相比, FA-RVFLNN 在泛化性能和网络规模上仍然具有一定的竞争力. 与各实验模型相
比, FA-RVFLNN 在评估指标 (泛化性能, 规则数, 网络规模) 下具有最好的综合性能表现.
事实上, 本文也提供了一种新的方法或思路: 尝试在模糊神经网络中引入结构简单并且可解释的 RVFLNN,