Page 26 - 《软件学报》2020年第11期
P. 26

3342                                Journal of Software  软件学报 Vol.31, No.11, November 2020

                                                             (AV Σ T  )
                                                                   i
                                              U ti (, ) j  ← U t i ( , ) j  tt  k  (, ) j             (8)
                                                               V V Σ
                                                           (U Σ  t  k t T  t  k T  ) (, ) j
                                                                     i
                                                              T
                                                            (AU Σ  )
                                                                   i
                                               V ti (, ) j  ←  V t i ( , ) j  t  t  k  (, ) j         (9)
                                                          (V Σ  t  k T U U Σ  t T  t  k ) (, ) j
                                                                     i
                                                           T
                                                         (UAV +  U AV  )
                                                                  T
                                                                       i
                                      Σ  ki (, ) j  ← Σ  k i ( , ) j  s  s s  t  t t  (, ) j         (10)
                                                         V V +
                                                                    V V +
                                                   (UU Σ  s T  s  k s T  s  UU Σ  t T  t  k t T  t  α  Σ  k ) (, ) j
                                                                              i
                    通过以上算法,可以在若干次迭代后,获得使J 取得最小值的 U s ,V s ,U t ,V t .这 4 个矩阵就是本文要求得的基因
                 调控网络的隐空间特征.对于训练集和测试集的每条边,将两端点的显式特征和隐空间特征向量作为特征、将
                 边的符号作为标签进行训练和预测,得到符号判别的结果.
                    以上基于隐空间特征的动态基因调控网符号判别算法伪码如算法 2 所示.
                    算法 2.  基于隐空间特征的动态基因调控网符号判别算法.
                    输入:邻接矩阵 A s 和 A t 、显式特征矩阵(记作 K s 和 K t )、参数 k.
                    输出:带符号的 T 时刻基因调控网邻接矩阵.
                    1.  初始化隐空间特征矩阵 U s ,V s ,U t ,V t 和Σ k .
                    2. WHILE  根据公式(8)极值 J 收敛.
                    3.  根据公式(9)更新 U s .
                    4.  根据公式(10)更新 V s .
                    5.  根据公式(11)更新 U t .
                    6.  根据公式(12)更新 V t .
                    7.  根据公式(13)更新Σ k .
                    END WHILE
                    8.  将 U s ,V s ,K s 按行拼接作为特征矩阵,使用 LibSVM 工具  [34] 对 A s 上的边的符号进行学习,得到分类模型.
                    9.  将模型应用到 At 上,得到符号判别的结果.

                 3    实   验

                    为了验证本文提出的 DGNE 方法在基因调控网的演化预测分析上的有效性,本节设计了一系列实验对本
                 文提出的 DGNE 方法进行分析和描述.本节首先设计了模型的选取和参数检验实验,在仿真数据集上测试,并获
                 得了能使本文提出的 DGNE 方法取得最优效果的算法参数的取值;然后对 DGNE 的时间复杂度进行了分析;最
                 后,本节设计了针对 DGNE 方法有效性的验证实验,在真实数据集上和对比算法进行比较,验证了该方法在动态
                 基因调控网网络演化分析中的有效性.
                 3.1   数据集描述
                    本文使用如下数据集对算法进行实验验证.
                    (1)  基因调控网仿真数据 3 组(以下分别记作 SynA、SynB、SynC).本文使用 GeneNetWeaver 3.1 工具               [35]
                        自带的 Ecoli 数据集,分别生成包括 300 个、600 个和 900 个基因,以及 20 个快照的动态基因表达数
                        据,每个快照的时间间隔为 1 000s.然后使用 TRaCE 程序            [7,8] ,将各快照的基因表达数据作为输入,得到
                        各个快照的基因调控网的邻接矩阵.该数据为通过仿真软件得到仿真实验数据,在软件中,我们可以
                        方便地对数据中的噪声和产生的环境进行控制,不同的规模可以用来验证算法的普适性.
                    (2)  果蝇基因调控网数据(以下记作 Dro)是一组无符号动态基因调控网数据集,由 Song 等人                        [36] 在文献中
                        直接以邻接矩阵的形式提供.该数据集包括果蝇在其不同的生命周期中基因调控网拓扑结构.Dro 直
                        观且真实地展示了低等生物在正常生理周期中的基因调控网的自然演化情况,在科研中非常具有现
   21   22   23   24   25   26   27   28   29   30   31