Page 31 - 《软件学报》2020年第11期
P. 31
刘中舟 等:动态基因调控网演化分析 3347
这种情况下的动态基因调控网网络演化是不足的,但即使如此,它也比其他现有算法在 AUC 和准确
率指标上有更好的表现.
Table 3 AUC of MT and its contrastive algorithms
表 3 MT 算法及其对比算法 AUC
SynC Dro Rat
MT 0.816 6 0.723 0 0.600 2
BCGD 0.712 2 0.694 4 0.519 8
ctRBM 0.790 1 0.680 1 0.501 6
PA 0.480 9 0.639 0 0.503 8
Katz 0.941 7 0.599 6 0.495 0
AA 0.524 9 0.687 9 0.500 2
CN 0.498 8 0.581 3 0.501 7
准确率
Fig.9 Precision of MT and its contrastive algorithms
图 9 MT 算法及其对比算法的准确率
3.4.2 进行符号判别的情况下 DGNE 方法的有效性验证
在考虑了符号判别的情况下,为验证算法在仿真与真实基因调控网上的性能表现,本文在 synC、Dro 和 Rat
数据集上进行各算法的比较.在考虑连边符号的状况下,不仅要考虑连边的有无,还要考虑连边的符号正负,因
此不再适用于 AUC 这一评价指标.图 10 是各算法的准确率的对比,其中,为了验证本文提出的符号判别算法中
显式特征和隐空间特征各自对算法表现的贡献,我们用 DGNE-E 指代在符号判别算法中只使用显式特征,
DGNE-L 指代在符号判别算法中只使用隐空间特征.需要强调的是,在本实验中,只有本文提出的 DGNE 方法是
与带符号的测试集进行对比,其他算法在进行准确率计算时,均忽略了测试集的符号信息(上述对比算法不提供
符号判别功能).
从图 10 的实验结果中可以得到以下结论.
(1) 与图 9 对比可以看出,在引入了符号判别之后,本文提出的 DGNE 方法的在各个数据集上的准确率略
低于其他对比算法.这是因为在该实验中,只有 DGNE 方法进行了符号判别,而其他算法并没有(也并
不能做到符号判别).相对于其他方法“一阶段”地对无符号网络的连边预测,本文创新地提出“两阶段”
的适用于带符号网络的 DNGE 方法对动态基因王进行连边预测,虽然为算法的整体性能引入了额外
的噪声与误差,但这种框架与网络模型更加贴近真实的动态基因调控网,从而能够在实际的生物医学
的应用中发挥更大的作用.
(2) 显式特征与隐空间特征的结合,能够使符号判别取得更好的效果,从而提升算法的整体性能.相对于
与仅仅使用显式特征进行符号判别,本文提出的将两类特征结合的 DGNE 方法能够提升 5%~10%的
准确率;隐空间特征对符号判别效果的贡献大于显式特征,相对于仅使用隐空间特征进行符号判
别,DGNE 方法也有约 3%~5%的提升.这说明在使用机器学习方法对带符号网络的符号进行判别的时
候,特征的构造的选取十分重要.