Page 21 - 《软件学报》2020年第11期
P. 21
刘中舟 等:动态基因调控网演化分析 3337
种调控关系为激励关系;反之为抑制关系.将这种基因调控关系映射为复杂网络中节点和边的关系,就是基因调
控网的基本形式.
定义 2(模体). 模体是网络中的一种特殊的子图结构,它在网络所有子图中占较大比例.在基因调控网中,某
些模体已被确定具有生物学意义 [28] .由于模体种类和结构复杂多样,本文无法完全覆盖,因此,本文研究的模体
仅限于由 3 个节点构成的子图.在有向网络中,3 个节点按照两两之间的连边状况,总共存在 64 种可能的连边情
况.为方便描述,将这 64 种模体分别编号并枚举,如图 2 所示.在网络中,任意 3 个节点都可以映射成一个模体.
Fig.2 Diagram of enumeration of motifs of gene regulatory network
图 2 基因调控网模体枚举示意图
定义 3(隐空间). 隐空间是一个人为设定的高维空间.将网络中的一条有向边映射到这个空间后,得到一个
用来表示其拓扑结构的特征向量,称为隐空间特征.将源网络中的有向边映射到隐空间后,就可以通过机器学习
方法进行目标网络的符号判别.其映射和符号判别过程如图 3 所示.
1 - 1 - 2 抑制边
- + 2 + 1 映射 激励边 学习
5 - + 2 ...
+ - ...
4 - 3 4 + 5
源网络 隐空间 分类模型
(a) 将符号已知的源网络的每条边映射到隐空间中,并以其符号为标签训练得到分类模型
1 1
5 2 映射 分类模型 5 2
4 3 4 3
目标网络 隐空间 带符号目标网络
(b) 将符号未知的目标网络用同样方法映射到隐空间中,利用上一步得到的分类模型预测目标网络有向边的符号
Fig.3 Diagram of symbol discrimination process based on latent space character
图 3 基于隐空间特征的符号判别过程示意图
1.2 基于模体的基因调控网问题建模
本文采用复杂网络的方法来描述基因调控网,基因调控的复杂网络定义如下.
一个有向图 G(V,E),其中,V 是所有节点的集合,E⊆V×V 是所有边的集合.节点的数量|V|被称为图的规模.在
有向图中,一条边是以二元组(u,v)的形式定义的(其中,(u,v)∈E),由节点 u 指向 v.本文通过如下形式将基因调控
网映射到一个复杂网络上:将每一个基因当作点集中的一个点,两点之间的有向边表示两基因之间存在调控关
系,从调控基因指向被调控基因.本文使用邻接矩阵对基因调控网进行描述,当|V|=M 时,Π是该基因调控网的邻
接矩阵,Π∈{−1,0,+1} M×M .对矩阵中的元素Π(u,v)做以下规定:Π(u,v)=0 当且仅当基因 u 不存在对基因 v 的调控
关系,Π(u,v)=1 当且仅当基因 u 对基因 v 存在激励的调控关系,Π(u,v)=−1 当且仅当基因 u 对基因 v 存在抑制的
调控关系.这样,基因调控网就以复杂网络的形式被表示出来了.