Page 22 - 《软件学报》2020年第11期
P. 22

3338                                Journal of Software  软件学报 Vol.31, No.11, November 2020

                    动态基因调控网是由若干个以一定时间按序排列的基因调控网快照组成的.将各快照中的所有节点 3 个
                 一组进行排列组合,即得到该快照中的所有模体.网络中的每一个模体都有且仅有一个代表其类型的编号.网络
                 演化的过程可以看作是模体转换的过程.从微观来看,一个模体在下一时刻要么保持原有类型不变,要么转换成
                 另一种类型的模体.本文通过描述统计 64 类模体的相互转换及概率,从而描述网络的演化过程.我们可以对比
                 从一种模体到另一种模体的转换过程中,哪些有向边产生、消失或方向改变,从而预测基因调控网中对应改模
                 体的子图在下一时刻的结构.上述过程如图 4 所示.
                                                        (b)
                      (a)
                                                              1          1         1          1
                             1                  1            49          9         50          3
                                                           2    3      2    3   3    4      3    4
                                2                   2
                                                             1           1         2          2
                        4                   4                                                 4
                              3                   3          49          10        3
                                                           2    4      2    4   3    4      3    4
                         快照 T                快照 T+1



                      (c)                                (d)      1

                            P (49→  9) =  Count (49→ 9)              ?
                                   Count (49→ Others )                2
                            P (49→  10) =  Count (49→ 10)     4
                                   Count (49→ Others )              3

                                                               快照 T+N
                             ⎛  ... ...  ...  ...⎞
                             ⎜               ⎟
                             ⎜  ... P (49→  9) P (49→  10) ... ⎟
                             ⎜  ... ...  ...  ... ⎠  ⎟
                             ⎝
                           (a)  某子图从快照 T 到快照 T+1 的演化,其中,节点 1 和节点 2 之间的有向边发生了方向反转.
                           (b)  从快照 T 到快照 T+1 共涉及到了 4 个模体的转换,其中,与节点 1 和节点 2 之间连边变化相关的
                             两个模体转换被标记出来,用作下一步的模体转换概率统计.
                           (c)  统计这两个模体的转换概率.Count(i→j)表示快照 T 中第 i 种三元组转换成第 j 种三元组的计数.
                           (d)  利用模体转换概率预测未来快照的连边情况(如在快照 T+N 中,节点 1 和节点 2 间是否存在连边).

                                 Fig.4    Diagram of modelling of gene regulation network based on motifs
                                            图 4   基于模体的基因调控网建模示意图
                    综上所述,本文所研究的问题可以描述为:对一个动态基因调控网络 G=(G 1 ,G 2 ,…,G T )的两两相邻快照间对
                 应节点组成的模体的变化趋势进行分析,结合隐空间特征中蕴含的有向边符号信息,最终揭示基因调控网络的
                 结构随时间变化的演化规律,得到未来时刻的基因调控网快照.
                 2    DGNE 方法

                    模体是基因调控网的功能单位.虽然当前基因调控网模体的结构与其生物学功能尚未一一对应,但至少可
                 以知道,在生物体内中,生命活动与基因调控网的模体演化是存在相互作用关系的.众所周知,生物的成长过程
                 具有一定的共性和规律,因此可以推断基因调控网模体演化也是具有共性和规律的,进而可以得出整个网络的
                 演化模式.本节将描述这种以模体演化为中心的 DGNE 方法.
                 2.1   DGNE方法框架
                    本文提出的 DGNE 方法以模体演化为中心.如图 5 所示,对于一个输入的动态基因调控网,首先将其映射为
                 模体,对相邻快照间的模体变化进行统计分析,同时结合其他网络拓扑结构特征,最终得到基因调控网未来时刻
   17   18   19   20   21   22   23   24   25   26   27