蛋白质网络建模及预测
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第二部分
蛋白质网络篇

第2章
蛋白质网络研究现状

人类基因组计划和多物种全基因组测序的完成[107, 108]拉开了蛋白质组(Proteomics)领域的帷幕。蛋白质组学主要研究蛋白质功能、结构、相互作用和环境,目标是完整描述一个生物体、单个细胞中的或处于特殊环境的所有蛋白质。蛋白质是各类细胞和组织必不可少的成分,是生物功能的执行者,也是生命现象的直接体现者。同时,细胞中的每个蛋白质并不是孤立存在的,每个生命过程的发生必然涉及到多个蛋白质。蛋白质及其相互作用不仅是正常生物过程的基础,也是在病理过程中起着重要的作用。通过蛋白质的相互作用,几乎所有的生物过程都能被精确地执行[2],例如,DNA复制、转录、翻译、物质代谢、信号传导以及细胞周期控制等一般生物过程。有些蛋白质的相互作用是平行发生的,有些蛋白质的相互作用则互为因果。一个细胞内所有的蛋白质相互作用可以组成一个错综复杂的网络,这样的网络称为蛋白质相互作用网络(PIN,也简称为蛋白质网络),是我们了解生命活动规律、诠释生命奥秘的基础。

复杂的生命系统最典型的特征就是动态性。生命体内的每个成分总处于不断变化之中。然而,大多数对蛋白质网络的研究普遍将蛋白质网络视为一个静态无变化的无向图,其中每个顶点表示一个蛋白质,每条边表示一对蛋白质之间的相互作用。从新陈代谢的角度来看,所有的生物分子都有着一定的寿命。例如,在细胞内的任一时刻,一些蛋白质分子被翻译出来,同时另一些蛋白质分子被降解掉。由于构成网络的生物分子的新陈代谢,使得生物体内的网络并非静止不变,而是始终处于动态变化的状态中。另外,蛋白质之间的相互作用不仅随蛋白质的存在和降解而动态变化,也随时间环境而动态变化。所以,蛋白质网络及其模块化结构组成也是动态的,在同一机体的不同发育阶段、不同生理状态甚至不同的外界环境下都会发生变化。例如,网络中的大多数信号转导分子之间在没有外部信号时并没有相互作用,仅在接收了特定的外部信号时,细胞内才会形成相应的信号转导通路,并执行其信号转导的功能,在信号转导完成后,信号转导通路中的各种蛋白质分子又将相互分离。

已有研究成果表明,疾病的发生和发展也与这种动态变化密切相关。例如,对心血管疾病的研究发现,有近百种蛋白质的改变与扩张性心肌病、心力衰竭和心肌缺血密切相关[52, 53]。然而传统的静态蛋白质网络没有办法体现这种动态性,因此在蛋白质网络上进行的蛋白质复合物/功能模块识别以及疾病相关等研究受到很大的局限。

目前,蛋白质组学领域的一些研究者发起了在时间和空间的范畴内对蛋白质组的描述规范的研究,旨在通过整合质谱仪、低温电子显微镜、细胞成像以及转动技术等现有技术平台,从时间和空间上探讨人类蛋白质组[109]。他们提出的第三代蛋白质组学技术是一个强大而灵活的刻画蛋白质组动态性的实验系统,为细胞生物学和分子医学提供了不可或缺的工具。

近年来,利用多元数据研究蛋白质网络的动态性及应用已成为生物信息学的研究热点,与实验系统遥相呼应。Y2H、MS实验和蛋白质芯片为代表的各种技术在不同条件下识别的蛋白质相互作用数据为动态蛋白质网络的构建提供了一个支架。基因微阵列技术、新一代测序技术产生了高通量的基因表达数据,为研究在不同发育、生长期和不同生理、病理条件下,不同细胞类型的基因表达建立了基础。生物实验技术的发展,使得产生的蛋白质亚细胞定位数据、质谱数据等其他数据从原来的低通量变为高通量。在多元数据的推动下,动态蛋白质网络的构建成为可能。

目前,研究者提出了一系列动态蛋白质网络的构建方法。我们将这些方法分为两大类[110]:基于蛋白质表达动态性的动态蛋白质网络和基于多状态下表达及相关性变化的动态蛋白质网络。