塑造生命的4大物理原理
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 DNA:构建生命体的代码和绳索

伦敦的国家肖像馆中悬挂着一块米色凝胶板,上面布满了细菌菌落。这幅艺术品的主角——诺贝尔奖获得者约翰·萨尔斯顿(John Sulston)的DNA副本(见图1-1)便藏身于此。尽管可能连萨尔斯顿的朋友都认不出这幅肖像,但艺术家马克·奎恩(Marc Quinn)认为,这幅作品“是肖像馆中最逼真的肖像”,因为“它里面含有创造萨尔斯顿本人的实际指令”。

图1-1 含有萨尔斯顿DNA的细菌菌落凝胶板

如今,甚至连小孩子都知道人类是由DNA以某种方式塑造而成的,它决定了我们眼睛的颜色、鼻子的形状及我们对香菜的好恶等。人们普遍认同这样一个观点:DNA可以为支配我们的指令编码,但“编码”究竟意味着什么?

我们将从DNA开始对生命体的体系和机制在生物物理层面进行探索。DNA的存在是人们所熟知的,而且是有标志性的,但它在许多描述中是抽象的。我们需要花费几个章节来理解指令是如何嵌入DNA中的,因为我们必须介绍什么是蛋白质和基因,以及这些成分之间的相互作用网络。在过去的几十年里,科学家们对这些片段如何形成信息及如何阅读信息的认识在不断发展,但DNA的复杂性仍有待破解。近年来,人们发现了一种方法,用这种方法可以操纵DNA中的代码,其前景令人充满期待,这是我们将在本书第三部分研究的主题。在本章中,我们只关注DNA本身,进而引申出生物学与物理学,以及科学与技术之间的联系。

关于DNA的四种观点

DNA不仅是一组抽象指令,而且是一种具有形状和结构的物质,它的物理特性与其功能密切相关。那么这种物质是什么?它是固体的,还是液体的?是僵硬的,还是松软的?是压缩的,还是松弛的?DNA具有多面性,我们可以根据自身关心的内容来关注它的不同方面。以下是关于DNA的四种观点。

第一,DNA是一种无色的黏性物质。我们可以将DNA握在手中,并且可以用肉眼看到它。这并不难做到:使用搅拌机和一些厨房化学品即可以从一碗草莓或一杯豌豆中提取到DNA。方法大致是这样的:首先,将水果或蔬菜倒入搅拌机中搅成泥,使它们的细胞相互分离;其次,朝里面添加去污剂以分解细胞膜;再次,撒上少许嫩肉剂或菠萝汁,以提供消化蛋白质的酶,此时DNA是其中仅存的完好无损的细胞成分;最后,再加入外用酒精,它会溶解蛋白质碎片,但不会溶解DNA。DNA此时会聚集成长链,你可以用牙签将其提取出来,这样就会得到一团混浊、黏稠的白色团状物(见图1-2),那就是DNA。这不是一个令人敬畏的景象。我曾经在一次课堂演示中泪流满面地提取DNA,但那是因为我做了一个可怕的决定——用洋葱作为原料。虽然洋葱没有颜色,而且容易获取,但用它做成的菜泥实在让人感到痛苦。

图1-2 牙签上是从食物中提取到的DNA

第二,DNA是一种密码。在有形性的另一个极端,我们可以将DNA视为由4个符号组成的抽象代码。这些符号通常用字母A、T、C、G表示,也可以用4种方块来表示(见图1-3)。特定的符号序列传达了细胞如何按照要求构建及执行的信息。信息量有多大呢?我们可以将其与存储在便携式音乐播放器中的数字信息量进行比较。如今,我们习惯用“位”(bit)和“字节”(byte)来作为数字信息的单位。一个位(二进制数字)指的是只能有两个值的任意事物:是或否,0或1,一块指向北或南的磁铁,等等。一个容量为1 GB(gigabyte)的U盘包含大约80亿位信息,giga的意思是“10亿”,一个字节是8位。它的内容是一条由80亿个1和0组成的特定字符串(…01110100110010100011011101000011011100011010011…)。每个人的DNA序列有多少位呢?30亿个符号——30亿个A、T、C、G构成了人体的DNA。例如,我们可以将每个符号转换为二进制代码,从而制作出一本字典:00=A;01=T;10=C;11=G。那么,像ATTGC这样的序列就相当于二进制的0001011110。因此,我们人类30亿个符号的基因组携带了60亿位信息——不到1 GB,可能这只是我们口袋里手机存储容量的一小部分。这就为我们抛出了一个难题:尽管我们携带的信息量明显比手机要少,但我们似乎比手机复杂得多。

图1-3 用4种方块表示DNA编码

在本书的大部分内容中,我们都在试图理解复杂性这个概念。现在有一个更直接的问题:这张代码和信息的抽象图片与前面所展示的团状物有什么关系呢?

第三,DNA是个分子。像所有分子一样,DNA也是由原子组成的,碳原子、氢原子、氧原子、氮原子和磷原子通过化学键结合在一起形成了DNA。上面提到的4个代码实际上是原子的4种组合,称为核苷酸,它们连接在一起形成一条长链。图1-4的a图描绘了腺嘌呤核苷酸(A)中的所有原子,其中碳原子为黑色,氮原子为白色,氧原子为浅灰色,磷原子为深灰色,黑线表示化学键。为了展现得更清楚,我在图中省略了许多氢原子。图1-4的b图则展示了由ACTG这4个核苷酸组成的序列中的原子,省略号(……)表示如果该片段属于一条较长的链,则位于这条链附近的核苷酸将会连接到它上面。在一条DNA链中,我们只需要辨别出其中一段核苷酸序列,就可以识别这个DNA分子——ACTG的简写完全等同于我们所描绘的原子阵列,而且它不能指代其他任何原子集。

图1-4 腺嘌呤和4种碱基ACTG的分子结构

第四,DNA是双螺旋结构。原子之间的相互作用决定了分子的结构,而分子的结构决定了它的功能。A、T、C、G这4种核苷酸中的任何一种,都可以与任何其他核苷酸连接形成单链DNA。但不同链之间的核苷酸也会以特定的方式相互作用,只不过这种作用力更弱:A和T相连接是这样,C和G相连接也是如此。我们认为A和T是互补的,C和G也是互补的。单链DNA,如AGCCTATGA会与其互补链TCGGATACТ结合。图1-5展示了由ACTG及与其互补的TGAC形成的双链DNA中的原子构成,其中浅灰色线表示链间键。原子之间的相互作用使得两条DNA链像扭曲的常春藤一样相互缠绕,形成双螺旋结构。图1-5与我们曾无数次看到的卡通双螺旋结构相呼应,其中光滑的带状物和有序的点是原子和键在三维空间中复杂的排列情况示意。

图1-5 DNA双螺旋结构

注:图中放大的部分展示了由ACTG及与其互补的TGAC形成的双链DNA分子结构示意图。

DNA的标志性双螺旋形式既实用又优雅,但两条互补链传达了许多冗余的信息:如果我告诉你一条链的序列,你就能知道另一条链的序列,因为每条核苷酸和它的搭档都是互补的。这些冗余的信息揭示了在细胞分裂时,信息是如何从一个细胞传递到它的两个子细胞中的:解开DNA后可以得到两条原始链,用它们的互补链与之结合便可以得到两条DNA双螺旋。

英国物理学家罗莎琳德·富兰克林(Rosalind Franklin)和当时还是研究生的雷蒙·葛斯林(Raymond Gosling)对DNA进行了精细的X射线测量,在此基础上,詹姆斯·沃森(James Watson)和弗朗西斯·克里克(Francis Crick)在1953年解析出了双链DNA的结构(1)。在此之前,没有人知道DNA分子可能是什么样子的。最著名的假说来自首先提出现代化学键概念的化学家莱纳斯·鲍林(Linus Pauling),他怀疑DNA形成了三股绞合纤维(三螺旋)。双螺旋结构清楚地表明了DNA的结构是如何通过复制互补链来实现遗传信息的转移的。然而,DNA结构的其他效应并不那么明显,直到今天我们仍在试图解开DNA的奥秘。

在活细胞和体外无菌试管的溶液中,如果不同的单链DNA的核苷酸互补,那么这些单链DNA会自发地形成双螺旋结构,不需要外部支架或微观绳索和滑轮的帮助,因为DNA包含其自身的组织机制,这突显了我们在探索生命的过程中反复提及的自组装主题。

以上关于DNA的4种观点,其中的每一种都是有意义的,它们分别强调了与DNA各种角色相关的属性。

从细胞泥中提取的纤维黏液可能是平平无奇的,但如果DNA的所有更迷人的用途要发挥作用,就必须承认它的这种物质特性和有形特征,这些用途包括从癌细胞中提取DNA以绘制癌细胞所携带基因的图谱,从犯罪现场收集DNA以追踪嫌疑人,等等。作为抽象代码,DNA分子中的符号序列明确了它所携带的信息。我们之所以认为每个人的DNA都是独一无二的,是因为每个人的核苷酸序列或者说“方块”与其他人的不同。当然,只是略有不同,毕竟99%以上的“方块”都相互匹配。当我们表示知晓某个生物的基因组时,意味着我们知道其核苷酸的完整序列。显然,这为我们提供了很多信息,但也留下了很多的不确定性。例如,如果我们正在设计一个用以切割或拼接DNA链(这些内容我们将在第三部分提及)的工具,可能需要关注到原子级别的细节——构成DNA原子的准确结构,而不仅仅是其成分的符号代码。不过在大多数情况下,我们只要了解A、C、G、T这些碱基的排列顺序就足够了。双链螺旋描述了DNA是如何在空间中定位的,双链DNA的大小、形状、硬度和电荷决定了它在细胞中的包装形式及它所包含的信息被读取的方式。

接下来我们将了解一个改变了生物技术领域的反应过程:聚合酶链反应。这将是我们对双链DNA的物理特性之重要性的第一个说明。

DNA会解链吗

想象一下,如果你想制作某些DNA的精确副本,那么首先要从分离双螺旋的两条链开始,然后再为分离出来的每一条链创建一条新的互补链。事实上,这就是我们的细胞在每次分裂时所做的事情,细胞通过一种特定的蛋白质机器来实现双链DNA的初始解链。在细胞外,我们开发了另一种方法,这种方法可以允许我们随意复制DNA,并将少量DNA转化为无数相同的副本,以产生足够的材料来对新目标进行测试或将它们转运到新目标中。例如,可以从犯罪现场中获取微量的核苷酸链,然后将它们与嫌疑人的DNA进行比对以评估二者的相似性;可以从胎儿周围的羊水中获取样本,用来探测遗传异常及细菌或病毒DNA是否存在;可以从肿瘤上切下样本,用来绘制核苷酸代码中指示癌症的突变;也可以从诺贝尔奖获得者身上提取DNA,以片段形式复制它们并将其重新植入细菌中,从而形成一件艺术品。就像自然复制一样,DNA的人工复制依赖于将双螺旋分离,而这种分离又依赖于相变(2)这种物理现象。

与其问如何分离DNA双螺旋的两条链,不如想一想如何分离冰块中紧密相连的水分子。答案是:加热。高于0℃,冰会融化成液态水,每个水分子都在其中四处“漫步”,并且只是短暂地与其他分子结合在一起。一般来说,温度是吸引力和秩序的克星,这是物理学中反复出现的主题。对于水来说,其从固体到液体的转变过程是急剧的,这种现象会精确地发生在“熔化温度”,即标准大气压下的0℃下。即使微微低于0℃,水也是固体;但温度稍高一点,水就是液体。然而,并不是所有物质的形态变化都是急剧的。当加热蜂蜜时,蜂蜜的黏性会随着温度的升高逐渐降低(更容易流动),而不是在某一特定的温度下突然发生变化。

回想一下,DNA双螺旋中两条链之间的键比一条链内部的键要弱,因此,我们期望可以通过加热的方式来分离DNA链,同时不破坏它们。事实上,情况就是如此。但这种转变是急剧的还是平稳的?换句话说,DNA是通过熔化来进行转变的吗?如果我们想要分离DNA双链来复制DNA,这个问题的答案就显得至关重要了。如果DNA是通过熔化进行转变的,我们可以确定,通过提高温度,就可以实现双螺旋的完全分离,即使所提高的温度只比转变温度高几摄氏度(见图1-6a)。如果DNA不是通过熔化进行转变的,那么我们可能将无法对一些DNA实现分离复制(见图1-6b)。

图1-6 DNA通过熔化来转变与不通过熔化来转变的两种情况

如果DNA不是通过熔化来转变的,那么,尽管我们可以一直加热直到DNA的每一个片段都完全分离,但实际上这可能需要达到相当高的温度,而这也会导致DNA本身和其上面存在的任何其他生物分子都被破坏。

事实证明,双链DNA转变为单链的过程是一个急剧的转变过程。DNA确实会解链(3)如果我们拿一个装有DNA的烧杯并加热它,那么在达到特定的解链温度之前,DNA分子都会保持双链形态;而当高于那个特定的解链温度时,DNA分子会解离成单链。我们不仅可以在实验室中测量DNA的解链温度,还可以了解它的起源。DNA的解链是从有序到无序的转变,尽管会存在一些微妙的差别,但这个过程也可以映射到其他转变中去。

所有的相变都反映了有序与无序之间的冲突。有序通常是在吸引力或某种使物质整齐排列的作用力下形成的,而无序通常由几何学驱动。在无序状态下,物质的成分在空间中会实现自我排列。温度的升高会放大无序的影响。在低温下,有序更具优势;而在高温下,无序则占主导地位。例如,水分子在低温时会以晶体形式排列而凝结成冰,如果温度升高,它们就会屈服于随机性更强的液体状态。我们认为熔化转变是急剧的,这意味着存在一个能够将这两种状态分开的特定温度,也就是说有序相和无序相之间存在着一个明确的界线。

有序的能量和无序的多样性都取决于物质可以探索的维度。相变的结果是戏剧性的:一般来说,基于理论预测,一维材料不应该在相之间表现出急剧的转变。例如,排成一排的水分子不会在某个特定的温度下熔化;即使在可以达到的最低温度下,水分子也会表现为无序状态,并且这种无序会随着温度的升高而稳定增长。

与之类似,双链DNA的长链是一维的,就像楼梯上依次排列的台阶。但是在实验室中很容易观察到DNA发生急剧熔化,这似乎与我们的预期背道而驰。然而,当DNA链解开以后,释放出来的灵活单链DNA受到所有分子共有的随机力的影响,会在三个维度上弯折和扭曲(见图1-7)。我们将在本书中进一步探索这种特性。尽管运动是随机的,但其结果是稳健且可预测的——这是另一个反复出现的主题,因为由此产生的构型自由为双链整体分离提出了精确的解链温度。这种情况通常存在于三维材料中。有了实验数据和理论依据,对于一条给定的DNA序列,我们就可以预测它解链时的温度。这种转变温度通常在95℃左右,略低于水的沸点,具体数值取决于特定的核苷酸序列。

图1-7 释放的单链DNA会在三个维度上弯折和扭曲

因此,我们可以在试管中通过加热来将DNA解链。复制DNA的下一个任务是创建每条链的互补链。此时,我们可以借用一种名为DNA聚合酶的细胞机器。但在DNA解链所需的温度下,这种蛋白质会变成一种橡胶球,从而导致其机能无法正常运行,就像煮熟的蛋清一样。事实上,蛋清的主要成分就是蛋白质。然而,有一个聪明的方法可以解决这个问题:我们可以使用存活于热泉中的细菌的DNA聚合酶。对这些生活在热泉中的生物来说,其蛋白质已经进化到在高温状态下也可以稳定地发挥功能。像所有DNA聚合酶一样,它们需要一小段双链DNA才能开始复制单链(见图1-8)。早在20世纪80年代,人们就已经掌握了这些成分,例如,1976年,细菌学家发现并提纯了热泉生物的DNA聚合酶。1983年,科学家凯利·穆利斯(Kary Mullis)(4)在深夜驾车穿越加利福尼亚州的海岸山脉时参悟到了结合核苷酸、聚合酶、温度和DNA的数据,同时他也意识到这种方法可以将DNA简单地、近乎无限地复制下去。该过程现在被称为聚合酶链反应(polymerase chain reaction,PCR)。

图1-8 DNA聚合酶复制DNA

如图1-9所示,为了进行PCR,首先要将各种成分溶解在盐水溶液中,包括我们想要复制的少量DNA、DNA聚合酶蛋白、丰富的单个核苷酸(A、C、G和T)及许多引物(primers)。引物是指只有几个核苷酸长的DNA片段,它们与需要复制的DNA末端互补。

图1-9 聚合酶链反应所需要的成分

接下来,让我们将温度提高到95℃左右,在这个温度下DNA将熔化,并由原来的双螺旋转变为两条单链(见图1-10)。

图1-10 聚合酶链反应在95℃时DNA双螺旋将转变为两条单链

然后将温度降低,以便引物与单链DNA的末端结合。溶液中有非常多的引物,因此单链DNA遇到引物的概率要远远大于遇到其原始互补链的概率,此时我们就让可预测的随机性发挥作用。之后聚合酶会结合并合成互补的DNA链(见图1-11)。当这一反应完成时,我们就可以由原来的一条双链螺旋DNA得到两条双链螺旋DNA。

图1-11 聚合酶链反应在温度降低时的情况

最后,我们重复这一过程。再进行一轮升温和降温循环后,我们可以得到4条DNA片段;再下一轮得到8条;然后是16条、32条、64条……10次循环后将产生1 024条DNA;20次循环后将产生超过100万条DNA;30次循环后将会产生超过10亿条DNA。使用自动加热冷却装置并不难实现这一点。

因此,我们只需要提取少量DNA并将其转化为大量相同的DNA,就可以得到一大批复制品,从而将其用在任何需要的地方,如诊断、法医鉴定或治疗等。在生物体内,需要通过复杂的繁殖步骤来创造出一个全新的细胞,甚至是一个新的生物体,以此来复制DNA;而通过聚合酶链反应,我们可以随意复制DNA,而且这简直易如反掌。正如穆利斯自己所记录的那样,分子生物学家们在得知他的发明后“几乎普遍的第一反应”是:“我为什么没有想到这一点?”穆利斯继续说道:“没有人真正知道为什么,我当然也不知道。我只是在一个晚上偶然想到了这个点子。”

通过复制DNA,我们可以创建足够的DNA副本来对其进行“测序”。换句话说,就是使用我们将在第2章中描述的技术来确定其特定的核苷酸模式。通过这种方法,我们绘制了人类和其他许多生物的基因组图。

你可能会好奇,既然PCR需要引物来结合我们感兴趣的DNA,从而产生一个较短的双链序列,那么难道我们不需要在开始之前就了解自己想要扩增的序列吗?其实并不完全是这样。首先,在许多关于生物体DNA的研究与应用中,我们确实知道这些生物体基因组的某些片段,并且可以设计与该片段结合的引物。不过,在大多数情况下,我们都是将未知的DNA切割成片段,再使用天然的蛋白质将这些片段与我们熟知的DNA(如容易生长的细菌基因组)缝合在一起。然后,已知部分的DNA的引物将会启动DNA聚合酶,并将其进程延伸到未知部分。已经灭绝了几千年的长毛象的基因组正是通过这种方法得以从其古代遗骸中测序成功的。

PCR对于与DNA相关的一切应用来说几乎都是必不可少的,它是通过将生物学的特殊性(如嗜热的微生物)和物理学的一般性(熔化相变)相结合来实现的,尽管这两者单独来看似乎与实际目标毫无关联。PCR还强调了许多现代技术及自然过程的核心信息:DNA不仅仅是代码或某种抽象概念,还是有形的物理对象。尤其是掌握了自组装和可预测的随机性的概念之后,我们对DNA有了更为深刻的理解,甚至可以创造和使用这种关键分子。

关于DNA,仍然有很多问题摆在我们眼前:你有多少DNA?你的细胞如何存储、组织和破译DNA?如何改变自己(或你未出生的孩子)的基因组代码?这些问题将DNA的物理特性和生物功能紧密地联系在了一起。不过,想要回答这些问题,我们需要先介绍细胞阶段的另一个关键参与者——蛋白质。在第2章中,我们将了解蛋白质是什么,并研究蛋白质和DNA之间的相互作用。