第二节 系统生物学
一、系统生物学概述
系统生物学(systems biology)诞生于三大科学方法论的基础上,是研究一个生物系统中所有组成成分(DNA、mRNA、蛋白质等)的构成以及在特定空间、时间条件下这些组分间的相互关系,并分析生物系统在一定时间内动力学过程的学科。
人体是一个复杂的自组织、自调节、自稳定的生物系统,该系统(整体)又分成若干个子系统(要素),比如呼吸系统、循环系统、消化系统等,每个子系统由不同的器官组成,器官由组织组成,组织由细胞组成(层级关系),各子系统之间在神经、体液调节下相互联系、相互影响而协调工作(交互作用),各子系统、器官的结构不同,执行各自的功能(分化),使机体维持健康状态(稳定性、均衡性),一旦内外环境变化超过系统自调节、自稳定(阈值)能力,就会发生结构和功能的异常,进入疾病状态,而这些变化的本质是核酸、蛋白质、脂质、糖类及其代谢产物等生物分子的代谢发生紊乱,而在健康与疾病的不同阶段,系统的结构、功能会在物质代谢的基础上发生规律性变化(动态性),系统生物学的目的就是对这些信息进行整合与干预。
二、系统生物学的灵魂——整合
系统生物学的灵魂是整合。系统生物学与各种“组学”的不同之处在于,它是一门整合型科学。首先,它要对系统内不同功能的构成要素(DNA、mRNA、蛋白质、生物小分子等)进行整合;其次,对于多细胞生物而言,需要进行从基因到细胞、到组织、到器官、到系统,个体(全身)的各个层级的整合;第三层面是研究思路和方法的整合;第四层面是学科的整合(“湿”——实验室内的研究;“干”——计算机模拟和理论分析)。
以经典的分子生物学为例,首先在DNA水平上寻找特定的基因,然后通过发现或人为诱导基因突变、进行基因敲减等手段研究该基因的功能;在基因研究的基础上,研究蛋白质的空间结构、蛋白质的修饰以及蛋白质间的相互作用等。基因组学、蛋白质组学和其他“组学”属于水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。而系统生物学的特点,则是要把水平型研究和垂直型研究(多组学、多层级)整合起来,并进行动态观察,成为一种“三维”的研究。
系统生物学还需要生命科学、信息科学、数学等各种学科交叉、共同参与。其中,计算机建模是系统生物学重要部分。一个细胞内有多个信号通路,信号通路内有多个信号分子,信号通路之间相互交叉,形成了复杂的网络关系,可以把已知的这些关系输入到计算机去建立生物系统模型。网络药理学是典型的系统生物学研究成果,它是基于系统生物学的理论,选取特定信号节点,通过计算机建模,对已知信息进行分析整合,进行靶点药物分子设计的新学科。
我们开展的绝大多数科研工作是假设驱动性的科学,即在较多已知基础上对未知做出假设,再通过研究验证假设。生命组学是一门发现的科学,通过基因组学、蛋白组学、代谢组学技术检测出疾病状态下几乎所有生物分子的异常变化。系统生物学就是把假设驱动的科学和发现的科学两者整合起来,形成一个研究闭环,包括基于数据和假设驱动的计算机造模、在此基础上进行“干”的模拟实验,再进行系统分析和理论构建,在此基础上做出预测和实验设计,开展组学技术为主的“湿”的实验室研究,应用生物信息学知识进行实验数据分析,获得的新发现再用来完善和丰富计算机模型,如此循环使系统生物学不断向前发展。
三、系统生物学的基础——信息
系统生物学的基础是信息。在前分子生物学时代,人们把生命看作是具有特殊“活力”的有机体;在分子生物学时代,人们把生命看作是精密机器;而在后基因组时代,生命则被看作是信息的载体。
根据系统论的观点,构成系统的关键不是其组成的物质,而是组成要素间的关系和/或相互作用。这些关系或者相互作用,本质上就是信息。生命系统为了维持其有序性及稳定性,必须不断地与外部环境交换物质、能量与信息。以分子生物学的中心法则来解释,基因激活后被转录成mRNA,然后在tRNA和核糖体的共同作用下,在粗面内质网上合成蛋白质,作为信号通路中分子、酶、受体、激素、离子通道等执行特定功能,蛋白质相互作用组成信号通路网络,这些网络调控细胞功能,细胞再组成组织、器官以及系统,然后再由多系统构成人体,所有生命活动都贯穿着信息流。
四、系统生物学的钥匙——干涉
系统生物学是一门实验科学,一方面要了解生物系统的结构组成,另一方面要揭示系统的行为方式,后者更为重要。系统生物学的钥匙是干涉(perturbation),即所研究对象并非一种静态的结构,而是要在控制的状态下,揭示特定的生命系统在不同的条件和时间里的动力学特征。控制论中提到的黑箱理论主要依靠干涉来分析其输入-输出信息。基础研究中常通过增强或阻断某条信号通路,或者敲除某个基因从而对正常信号通路进行干涉,以验证某个因素对该通路的影响。而在医学研究中,往往是系统的、定向的、高通量的干涉和分析,因为即使只有一个药物进入人体,也会影响多个信号通路的活动。
五、系统生物学的基本方法——组学
系统生物学最基本的方法是组学,大发现时代的生命组学(life omics)是以组学的策略、技术和思路来研究生命体发育、组成、代谢和疾病等规律的一门综合性学科,以基因组学、转录组学和蛋白质组学为基础,囊括了包括脂质组学、糖组学、代谢组学、微生物组学等组学范畴。组学是有时序性的,首先基因激活后转录,随后翻译成蛋白质,蛋白质调控机体的代谢,在代谢基础上影响功能。同时,组学是“分层”的,在组学相关研究中不同的状态其组学变化不同,因此“过程和环节”至关重要。如同一疾病的不同阶段——潜伏期、前驱期、临床期、恢复期,组学结果均有差异。