Page 31 - 《软件学报》2020年第11期
P. 31

刘中舟  等:动态基因调控网演化分析                                                              3347


                        这种情况下的动态基因调控网网络演化是不足的,但即使如此,它也比其他现有算法在 AUC 和准确
                        率指标上有更好的表现.
                                         Table 3    AUC of MT and its contrastive algorithms
                                               表 3   MT 算法及其对比算法 AUC
                                                      SynC        Dro        Rat
                                           MT         0.816 6    0.723 0    0.600 2
                                          BCGD        0.712 2    0.694 4    0.519 8
                                          ctRBM       0.790 1    0.680 1    0.501 6
                                           PA         0.480 9    0.639 0    0.503 8
                                           Katz       0.941 7    0.599 6    0.495 0
                                           AA         0.524 9    0.687 9    0.500 2
                                           CN         0.498 8    0.581 3    0.501 7








                                             准确率








                                        Fig.9    Precision of MT and its contrastive algorithms
                                             图 9   MT 算法及其对比算法的准确率
                 3.4.2    进行符号判别的情况下 DGNE 方法的有效性验证
                    在考虑了符号判别的情况下,为验证算法在仿真与真实基因调控网上的性能表现,本文在 synC、Dro 和 Rat
                 数据集上进行各算法的比较.在考虑连边符号的状况下,不仅要考虑连边的有无,还要考虑连边的符号正负,因
                 此不再适用于 AUC 这一评价指标.图 10 是各算法的准确率的对比,其中,为了验证本文提出的符号判别算法中
                 显式特征和隐空间特征各自对算法表现的贡献,我们用 DGNE-E 指代在符号判别算法中只使用显式特征,
                 DGNE-L 指代在符号判别算法中只使用隐空间特征.需要强调的是,在本实验中,只有本文提出的 DGNE 方法是
                 与带符号的测试集进行对比,其他算法在进行准确率计算时,均忽略了测试集的符号信息(上述对比算法不提供
                 符号判别功能).
                    从图 10 的实验结果中可以得到以下结论.
                    (1)  与图 9 对比可以看出,在引入了符号判别之后,本文提出的 DGNE 方法的在各个数据集上的准确率略
                        低于其他对比算法.这是因为在该实验中,只有 DGNE 方法进行了符号判别,而其他算法并没有(也并
                        不能做到符号判别).相对于其他方法“一阶段”地对无符号网络的连边预测,本文创新地提出“两阶段”
                        的适用于带符号网络的 DNGE 方法对动态基因王进行连边预测,虽然为算法的整体性能引入了额外
                        的噪声与误差,但这种框架与网络模型更加贴近真实的动态基因调控网,从而能够在实际的生物医学
                        的应用中发挥更大的作用.
                    (2)  显式特征与隐空间特征的结合,能够使符号判别取得更好的效果,从而提升算法的整体性能.相对于
                        与仅仅使用显式特征进行符号判别,本文提出的将两类特征结合的 DGNE 方法能够提升 5%~10%的
                        准确率;隐空间特征对符号判别效果的贡献大于显式特征,相对于仅使用隐空间特征进行符号判
                        别,DGNE 方法也有约 3%~5%的提升.这说明在使用机器学习方法对带符号网络的符号进行判别的时
                        候,特征的构造的选取十分重要.
   26   27   28   29   30   31   32   33   34   35   36