Page 21 - 《软件学报》2020年第11期
P. 21

刘中舟  等:动态基因调控网演化分析                                                              3337


                 种调控关系为激励关系;反之为抑制关系.将这种基因调控关系映射为复杂网络中节点和边的关系,就是基因调
                 控网的基本形式.
                    定义 2(模体).  模体是网络中的一种特殊的子图结构,它在网络所有子图中占较大比例.在基因调控网中,某
                 些模体已被确定具有生物学意义            [28] .由于模体种类和结构复杂多样,本文无法完全覆盖,因此,本文研究的模体
                 仅限于由 3 个节点构成的子图.在有向网络中,3 个节点按照两两之间的连边状况,总共存在 64 种可能的连边情
                 况.为方便描述,将这 64 种模体分别编号并枚举,如图 2 所示.在网络中,任意 3 个节点都可以映射成一个模体.












                                  Fig.2    Diagram of enumeration of motifs of gene regulatory network
                                               图 2   基因调控网模体枚举示意图
                    定义 3(隐空间).  隐空间是一个人为设定的高维空间.将网络中的一条有向边映射到这个空间后,得到一个
                 用来表示其拓扑结构的特征向量,称为隐空间特征.将源网络中的有向边映射到隐空间后,就可以通过机器学习
                 方法进行目标网络的符号判别.其映射和符号判别过程如图 3 所示.

                                   1  -       1 -  2                 抑制边
                                -   +         2 +  1    映射          激励边       学习
                              5  -  +  2        ...
                               +    -           ...
                                4 -  3        4 +  5
                                源网络                             隐空间                 分类模型
                               (a)  将符号已知的源网络的每条边映射到隐空间中,并以其符号为标签训练得到分类模型
                                   1                                                1
                              5      2       映射                    分类模型         5      2
                                4   3                                            4   3
                               目标网络                     隐空间                   带符号目标网络

                       (b)  将符号未知的目标网络用同样方法映射到隐空间中,利用上一步得到的分类模型预测目标网络有向边的符号
                              Fig.3    Diagram of symbol discrimination process based on latent space character
                                          图 3   基于隐空间特征的符号判别过程示意图
                 1.2   基于模体的基因调控网问题建模
                    本文采用复杂网络的方法来描述基因调控网,基因调控的复杂网络定义如下.
                    一个有向图 G(V,E),其中,V 是所有节点的集合,E⊆V×V 是所有边的集合.节点的数量|V|被称为图的规模.在
                 有向图中,一条边是以二元组(u,v)的形式定义的(其中,(u,v)∈E),由节点 u 指向 v.本文通过如下形式将基因调控
                 网映射到一个复杂网络上:将每一个基因当作点集中的一个点,两点之间的有向边表示两基因之间存在调控关
                 系,从调控基因指向被调控基因.本文使用邻接矩阵对基因调控网进行描述,当|V|=M 时,Π是该基因调控网的邻
                 接矩阵,Π∈{−1,0,+1} M×M .对矩阵中的元素Π(u,v)做以下规定:Π(u,v)=0 当且仅当基因 u 不存在对基因 v 的调控
                 关系,Π(u,v)=1 当且仅当基因 u 对基因 v 存在激励的调控关系,Π(u,v)=−1 当且仅当基因 u 对基因 v 存在抑制的
                 调控关系.这样,基因调控网就以复杂网络的形式被表示出来了.
   16   17   18   19   20   21   22   23   24   25   26