《基因传+癌症传》普利策奖穆克吉作品
上QQ阅读APP看书,第一时间看更新

第四章
基因定位

斑驳万物荣归上帝。

——杰勒德·曼利·霍普金斯(Gerard Manley Hopkins),
《斑驳之美》(Pied Beauty

我们突然遇到一对身材高挑且骨瘦如柴的母女,她们在弯腰扭身的同时流露出痛苦的表情。

——乔治·亨廷顿(George Huntington)

1978年,两位遗传学家受邀前往位于盐湖城的犹他大学参加研究生论文评审,他们是来自麻省理工学院的戴维·博特斯坦(David Botstein)与斯坦福大学的罗恩·戴维斯(Ron Davis)。本次会议在距离盐湖城只有几英里远的瓦萨奇山阿尔塔镇举行。就在博特斯坦与戴维斯感觉到索然无味时,突然有一个报告同时引起了他们二人的共鸣。该项目由研究生克里·克拉维茨(Kerry Kravitz)与导师马克·斯科尔尼克(Mark Skolnick)完成,而他们当时正在竭尽全力寻觅引起遗传性血色素沉着症(hemochromatosis)的致病基因。血色素沉着症自古以来就为医学界所熟知,病因是调节肠道铁吸收的基因发生了突变。随着血色素沉着症患者吸收大量铁元素,他们的身体也将逐渐出现铁负荷过量。肝脏与胰腺会出现功能障碍,皮肤也会变成青铜色甚至灰白色。血色素沉着症患者的器官将无一幸免,其身体仿佛变成一座铁矿山,就像《绿野仙踪》里的铁皮人,最终组织变性、器官衰竭并且导致死亡。

对于克拉维茨与斯科尔尼克来说,他们要挑战的这个难题尚处于遗传学研究领域的空白。到20世纪70年代中期,人类已经鉴别出成千上万种遗传病,其中就包括血色素沉着症、血友病以及镰刀形红细胞贫血症。不过发现了疾病的遗传属性并不等于确认了真正的致病基因。例如,血色素沉着症的遗传模式清晰地说明它属于某种单基因遗传病,可是该突变基因在患者体内却表现为隐性遗传,也就是说只有两个缺陷基因(分别来自父母双方)同时存在才会致病。然而这种遗传模式并未告诉我们血色素沉着症基因的本质与功能。

为了鉴别血色素沉着症基因的位置,克拉维茨与斯科尔尼克设计了一种精妙绝伦的解决方案。寻找致病基因的首要步骤是对染色体上某个特殊的区域进行“定位”:只要在特定染色体上确认了该基因的物理位置,那么便可以运用标准克隆技术完成分离、测序与功能验证。克拉维茨与斯科尔尼克推断,如果想要明确血色素沉着症基因在染色体上的位置,那么他们需要借助基因连锁的属性来进行分析。

现在让我们梳理一下整个实验的思路。假如血色素沉着症基因位于7号染色体,而在同一条染色体上的相邻基因可以决定头发质地(直发、微卷发、卷发以及波浪发)。假设在进化史上某个遥远的时刻,血色素沉着症缺陷基因出现在具有卷发的个体之中。那么父母每次将这个祖先基因遗传给后代时,卷发基因都会跟它一起如影随形:由于上述两个基因位于相同的染色体上,同时此类遗传物质的载体极少出现断裂,因此即便是这两个基因的变异体也不会分离。虽然这种关系可能在一代人中尚不明显,但是在历经几代人之后就可以得出某种统计学模式:该家族中具有卷发的孩子更有可能罹患血色素沉着症。

克拉维茨与斯科尔尼克的研究也得益于这个逻辑推理。通过分析犹他州许多具有错综复杂血缘关系的摩门教徒谱系档案,他们发现血色素沉着症基因在遗传时与某个免疫应答基因连锁,而后者拥有多达几百种变异体。鉴于早期研究已将该免疫应答基因定位于6号染色体,因此这就意味着血色素沉着症基因必定也潜伏在这条染色体上。

细心的读者可能会对此提出异议并且认为以上案例先入为主:血色素沉着症基因碰巧与相同染色体上的某个基因连锁,而该基因既容易辨别又具有高度的变异性状。不过这样的性状确实极为罕见。这种免疫应答蛋白存在多种易于识别的变异体,同时编码该蛋白的基因恰好与斯科尔尼克的目的基因比肩而立,因此这种幸运着实可遇而不可求。如果要使用同样的方法为其他基因定位,那么人类基因组中就需要分布着各式各样容易辨认的标记物,这岂不是相当于在染色体上均匀地设置好明亮的路标吗?

然而博特斯坦心里非常清楚,这种路标很可能就存在于染色体中。在经历了几个世纪的进化之后,人类基因组已经可以让DNA序列产生成千上万个微小的变异。而这些序列变异被称为“多态性”,也就是“多种形式”的意思。实际上它们与等位基因或变异体非常相似,只不过自身并不需要出现在基因中,它们可能就存在于两个基因之间的长段DNA或者内含子中。

我们可以把这些序列变异想象成分子版的眼睛或皮肤的颜色,而它们在人群中有成千上万种变化形式。某个家族成员的染色体可能会在特定位置携带一段ACAAGTCC序列,另一个家族成员在同样的位置则是一段AGAAGTCC序列,它们之间仅仅是一个碱基对的区别。 1978年,另外两名研究者简悦威(Y. Wai Kan)与安德里·多则(Andree Dozy)在镰刀形红细胞贫血症基因附近发现了一种DNA多态性,并且利用它追踪患者体内镰刀形红细胞贫血症基因的遗传规律。70年代末期,梅纳德·奥尔森(Maynard Olson)与同事们也根据DNA多态性描述了基因定位的方法。与头发颜色或者免疫应答不同的是,这些序列变异无法通过肉眼观察。它们不会引起表型改变,甚至不会影响到基因的功能。虽然它们不能通过常规的生物或物理性状进行区分,但是精细入微的分子技术可以提供鉴别的手段。例如,某个可以识别ACAAG但不可识别AGAAG序列的DNA剪切酶或许可以分辨出特定的序列变异。

※※※

20世纪70年代,当博特斯坦与戴维斯首次从酵母菌与细菌基因组中发现DNA多态性时,他们二人还不知道这种现象能有什么用处。与此同时,他们发现人类基因组中也散布少量多态性,不过这些人类变异序列的规模与位置尚不明确。诗人路易斯·麦克尼斯(Louis MacNeice)曾经感同身受地写下“心醉神迷迥然不同”的佳句。对于某位处于微醺状态的遗传学家来说,只要他想到人类基因组中到处都随机散布着微小的分子变异(就像遍布全身的雀斑),那么就会有种愉悦的感觉划过脑海,可是我们很难想象此类信息能发挥什么作用。或许这种现象还停留在华而不实的阶段,展现在眼前的只是一幅布满雀斑的地图。

然而就在犹他州的那个上午,博特斯坦在听完克拉维茨的报告后脑海中突然灵光乍现:如果人类基因组中存在上述变异的基因路标,那么只要将某个遗传性状与这种变异连锁在一起,就可以大致确定任意一个基因在染色体上的位置。这种像雀斑一样分布的遗传标记地图潜力巨大,它可以用来绘制反映基因位置的大体解剖图。多态性相当于基因组内部的全球导航系统,我们可以通过某个基因与序列变异的关系实现精准定位。到了午餐时分,博特斯坦已经兴奋得快要跳起来了。为了定位血色素沉着症基因,斯科尔尼克花了10多年来寻觅那个免疫应答标记物。博特斯坦对斯科尔尼克说:“我们可以给你提供各种所需的标记物……它们会布满整个基因组。”

博特斯坦意识到,定位致病基因的关键步骤不是寻找基因而是要找到目标人群。如果某个人数足够庞大的家族成员携带有任意相同的遗传性状,并且假设该性状可以与散布在基因组中的任意一种变异标记物相关联,那么基因定位的工作将变得易如反掌。对于罹患囊性纤维化的家族成员来说,如果他们全部“共同继承”了某些变异的DNA标记物,并且这些所谓的X—变异体就位于7号染色体的顶端,那么囊性纤维化基因也应该距离此处不远。

1980年,博特斯坦、戴维斯与斯科尔尼克将基因定位的概念发表于《美国人类遗传学杂志》(American Journal of Human Genetics)。博特斯坦写道:“我们为描绘人类基因组遗传图谱提供了新方法。”这项内容古怪的研究隐藏在某本名不见经传的杂志中,字里行间充斥着统计学数据与数学公式,而这不由让人联想起当年孟德尔那篇遗传学经典之作。

由于上述研究的内容非常新颖,因此需要人们逐渐理解其深刻内涵。我之前曾经说过,遗传学发展的关键在于概念转变,其间历经了从统计性状到遗传单位以及从基因到DNA的变迁。如今博特斯坦同样也实现了重要的概念转变,他将染色体描绘成遗传生物特征的人类基因分布图。

※※※

1978年,心理学家南希·韦克斯勒(Nancy Wexler)了解到博特斯坦关于基因定位的概念。之所以韦克斯勒会关注此项研究,是因为她自己的亲人曾经深受其害。1968年夏季,当时韦克斯勒年仅22岁,她的母亲莉奥诺·韦克斯勒(Leonore Wexler)在洛杉矶驾车时被警察拦下,理由是不遵守交通规则。莉奥诺并没有酒后驾车,她当时正遭受着不明原因抑郁症的折磨,可能突然就会出现情绪波动与行为异常,甚至还有一次曾经试图自杀,但是没有人意识她患有生理上的疾病。保罗与西摩是莉奥诺的两位兄弟,他们曾经是纽约某个摇摆乐团的成员。20世纪50年代,二人被诊断为患有一种叫作亨廷顿病(Huntington’s disease)的罕见遗传综合征。莉奥诺另一个兄弟杰西则是个喜爱魔术的推销员,而他在表演魔术时发现自己的手指会不自主地抖动。最终杰西也被诊断为亨廷顿病。虽然他们的父亲亚伯拉罕·萨宾(Abraham Sabin)于1926年死于亨廷顿病,但是莉奥诺一直认为自己会幸免于难。到了1968年5月,当莉奥诺去看神经科医生的时候,她已经开始出现痉挛性抽搐与舞蹈样动作,并且最终也被诊断为亨廷顿病。

19世纪70年代,来自美国长岛的乔治·亨廷顿医生首次报道了此类患者,而该病也因此得名为亨廷顿病。亨廷顿病曾经被称作亨廷顿舞蹈症(Huntington’s chorea),其中chorea在希腊语里是“舞蹈”的意思。当然,这种“舞蹈”与正常意义上的舞蹈大相径庭,这种毫无乐趣可言的病态模仿只是大脑功能失调的一种临床表现。通常来说,如果患者通过遗传获得了显性亨廷顿基因,也就是说只需要一个基因拷贝就可以导致亨廷顿病,那么他们在三四十岁之前并不会出现神经系统症状。患者起初可能只是偶尔经历情绪波动或者出现社交退缩的微弱迹象,然后他们的身体会出现难以察觉的轻微抽动,例如抓取物体会变得很困难,手指无法拿住酒杯与手表,就连肢体动作也逐渐演变为抽搐与痉挛。最终患者全身出现不自主的“舞蹈”动作,仿佛突然间开启了魔鬼的音乐。他们的四肢运动完全不受控制,身体会摆出各种扭曲与弧形的姿态,并且还经常被不时出现的晃动打断,这种过程“就像在观看某个巨型木偶表演……而真正的操纵者其实就隐身于幕后”。该病发展至晚期会出现深度认知能力减退合并运动功能几近完全丧失。患者最终将在“舞蹈”的陪伴下死于营养不良、痴呆或者感染。

造成亨廷顿病患者预后不良的原因部分在于它起病时间较晚。亨廷顿基因携带者到了三四十岁才发现自己的宿命,而彼时他们已经为人父母。该病就以这种方式躲过了残酷的进化并悄然蛰伏在人体中:自然选择甚至还没来得及清除致病基因,它就已经传递至下一代。由于每位亨廷顿病患者都具有一份正常拷贝与一份突变拷贝基因,因此其子女的患病概率为50%。对于这些孩子来说,他们的生命将陷入一场残酷的赌局。正如某位遗传学家所描述的那样,这只是一场“等待症状发作的游戏”。某位患者曾经写下面对这种茫然无助时惊恐万状的感受:“我不知道灰色的世界何时才是尽头,也不敢想象等待我的是何种更加悲惨的命运……而我只是这个恐怖游戏中束手就擒的玩家,眼睁睁地等着疾病发作与肆虐。”

※※※

南希的父亲米尔顿·韦克斯勒(Milton Wexler)是洛杉矶的一名精神病学家,他在1968年将妻子的诊断透露给两个女儿。尽管南希与爱丽丝那时还没有症状,但在没有进行任何基因检测的前提下,她们二人都有50%的概率患病。米尔顿·韦克斯勒告诉女儿:“你们每个人都有二分之一的概率得这种病。而且一旦确诊,你们的孩子也会有二分之一的概率得病。”

南希·韦克斯勒回忆道:“当时我们姐妹俩紧紧抱在一起失声痛哭,我根本无法忍受这种坐以待毙的感觉。”

米尔顿·韦克斯勒在当年成立了一家叫作遗传病基金会的非营利机构,致力于资助有关亨廷顿病与其他罕见遗传病的研究。韦克斯勒认为,寻找亨廷顿病的致病基因才是诊断、治疗以及治愈的基础。这将让他的女儿们掌握预测的手段,并且提前为疾病的到来做好准备。

与此同时,莉奥诺·韦克斯勒已逐渐病入膏肓,就连说话也开始不由自主地变得含糊起来。她的女儿回忆道:“新鞋买来没穿上多长时间就会磨坏。在疗养院的时候,她所坐的椅子就位于床与墙壁之间的狭小空间里。无论椅子摆放在何处,她的身体在持续运动中发出的力量都会把它推向墙壁,直到她的头撞上墙面才被迫停下来……持续运动会使亨廷顿病患者日渐消瘦,他们的体重与症状加深呈反比关系,而其中的原委并没有人能说清楚,因此我们也试图增加她的体重……她曾经面露欣喜地在半小时内吃掉了一磅土耳其软糖。可惜她的体重并未增加,反倒是我长胖了。我陪着她一起胡吃海塞,只有这样才能忍住悲伤。”

1978年5月14日,莉奥诺离开了人世。1979年10月,也就是在母亲去世17个月之后,南希在华盛顿参加了一场遗传学研讨会,她正是在此听说了博特斯坦的基因定位技术。由于该技术在很大程度上还停留在理论阶段,并且当时还没有成功定位人类基因的先例,因此使用它来寻找亨廷顿基因更是遥不可期。毕竟这项技术的关键在于疾病与标记物之间的关联程度:只有在患者数量充足以及关联程度非常密切时,遗传图谱才能更加精确地反映真实情况。可是在整个美国仅有零星分布的几千名亨廷顿病患者,而这看上去并不符合基因定位技术所需的必备条件。

即便如此,南希·韦克斯勒脑海中有关基因定位的画面也始终挥之不去。就在几年之前,米尔顿·韦克斯勒从一位委内瑞拉神经病学家口中得知,委内瑞拉马拉开波湖(Lake Maracaibo)沿岸的巴兰基塔斯(Barranquitas)与拉古内塔斯(Lagunetas)村亨廷顿病发病率非常高。那位神经病学家曾拍摄过一部模糊不清的黑白影片,米尔顿·韦克斯勒从中看到有十几位村民摇摇晃晃地走在街上,画面中人们的四肢在不由自主地颤抖着。他据此认定这个村子里存在大量的亨廷顿病患者。南希·韦克斯勒推断,只有获取这些委内瑞拉患者的基因组标本,博特斯坦发明的基因定位技术才有可能起效。虽然巴兰基塔斯村距离洛杉矶有几千英里之遥,但是南希寻找家庭成员致病基因的希望就寄托在此。

1979年7月,韦克斯勒启程前往委内瑞拉去追踪亨廷顿基因。她写道:“我曾经在人生中做出过几次重大抉择,而只有这一次让我感到忐忑不安。”

※※※

初次来到巴兰基塔斯的访客刚开始可能不会注意到这里的村民有任何特殊之处。某位男子从尘土飞扬的小路上走来,他的身后跟着一群赤膊的儿童。另有一位瘦弱的黑发女子正从铁皮屋顶的窝棚里钻出来,她穿着碎花裙子走向集市。此外还有两位男子相对而坐,他们正在闲聊与打牌中消磨时光。

不过这些最初的正常印象旋即原形毕露。前面那位男子走路时的步态看上去极不自然。他每走几步身体就会剧烈抽动一下,其间手部还不时会在空中画出蜿蜒的弧形。他突然浑身抽搐着冲向路边,随后又挣扎着让自己回到原来的路线,有时他的面部肌肉在收缩时还令其表现为眉头紧锁。那位女子的双手也在抽搐中扭动,同时还围绕身体在空中画出半圆。她体形孱弱且流着口水,已经出现进行性痴呆的症状。至于那两位闲聊的男子,其中一位突然冲上去把对方紧紧抱住,等风平浪静后他们继续聊着前面的话题,好像什么都未曾发生过。

20世纪50年代,当委内瑞拉神经病学家亚美利哥·内格瑞特(Américo Negrette)第一次来到巴兰基塔斯时,他还以为自己在这里遇见的村民全都是酒鬼。不过他很快就意识到自己错了:对这些表情痴呆、面部痉挛、肌肉萎缩以及出现不自主运动的人来说,他们所有的神经系统症状均源自亨廷顿病。这种遗传病在美国非常罕见,发病率大约在万分之一左右。相比之下,在巴兰基塔斯村与毗邻的拉古内塔斯村部分地区,亨廷顿病患者或者基因携带者的数量高达2 000人,平均每10人到20人中就有一人患病。据报道,他们体内的致病基因均来自一位叫玛利亚·康塞普西翁(María Concepción)的女性,尽管她的名字看上去很奇怪,但是在此却非常贴切(concepción在西班牙语里是怀孕的意思),她养育的后代成为19世纪以来上述村落中首个携带突变基因的家族。亨廷顿病在这里可谓无处不在,以至于当地人将其称为魔鬼(西班牙语el mal)。

※※※

1979年7月,韦克斯勒来到马拉开波湖。她先是从当地雇了八位工人,然后沿湖畔冒险进入这些讲西班牙语的村落,并且开始记录患者与正常人的家族谱系(尽管韦克斯勒原先只是一位临床心理学家,但是那时她已经成为世界上研究亨廷顿病与神经退行性疾病的顶级专家之一)。她的助手回忆道:“那里根本无法开展研究工作。”韦克斯勒在当地建立了一个临时性流动诊所,以方便神经病学家在确诊患者的同时完成症状描述,并且顺便为他们提供科普宣传信息与支持性治疗。韦克斯勒对携带两个致病基因拷贝(纯合子)的人群非常感兴趣,此类个体的父母也必须是亨廷顿病患者。某天清晨,一位当地渔民带来了重要线索:他知道在距离湖边大约两小时路程的地方有一片水上棚屋,那里有许多家庭正在遭受魔鬼的摧残。那么韦克斯勒愿意冒险穿过沼泽前往此处一探究竟吗?

她当然不会错失这个良机。第二天,韦克斯勒与两名助手乘船驶向这个水上村落。他们忍受着闷热的天气在河汊里转了好几个小时,终于在某个水湾的拐角处看到了一位村妇,她身着棕色图案的连衣裙正盘腿坐在门口。小船的到来显然惊动了那位女性,她在起身走进房间的途中突然表现出亨廷顿病特征性的舞蹈样动作。就在这片远离家乡的土地上,韦克斯勒亲眼见到了令人心痛的病态舞姿。她回忆道:“这是一种似曾相识的碰撞,我感到既熟悉又陌生,简直无法控制内心的激动。”

片刻之后,就在韦克斯勒驾船驶入村落腹地时,她发现一对躺在吊床上的夫妇正在摇摆之间兴奋地手舞足蹈。村子里共有14名成人,他们全部是亨廷顿病患者与基因携带者。当韦克斯勒采集了他们以及子女的信息之后,其记载的家族谱系资料便迅速丰富起来。只用了几个月,她就已经整理出一份包含有数百位亨廷顿病患者的名单。在接下来的日子里,韦克斯勒组建了一个包括专业医生与护士在内的团队,他们深入这些零星分布的村落逐一收集患者血液样本。随后这些血样被送往波士顿麻省总医院詹姆斯·古塞拉(James Gusella)与印第安纳大学遗传学家迈克尔·康奈利(Michael Conneally)的实验室。

在波士顿,古塞拉用酶把从血液细胞中提纯出的DNA切断,然后试图找出一个与亨廷顿基因连锁的变异序列。而康奈利的研究小组则对数据进行了统计分析,并且通过量化手段来了解DNA变异与亨廷顿病之间的联系。原本这个三方团队预计工作不会开展得那么顺利,毕竟需要筛选成千上万个多态变异序列,但是他们很快就有了惊人的发现。1983年,也就是在收到血样后仅仅3年,古塞拉的团队碰巧发现一段位于4号染色体的变异DNA与亨廷顿病密切相关。值得注意的是,古塞拉的团队也给一群人数要小得多的美国亨廷顿病患者采集了血样,他们同样在其中发现了4号染色体上与亨廷顿病密切相关的DNA标记。由于上述两个独立人群表现出相似的内在联系,因此可以说该病与遗传关联的事实确凿无疑。

1983年8月,韦克斯勒与古塞拉在《自然》杂志发表论文,他们明确指出亨廷顿基因就位于4号染色体上的一处远端位点—4p16.3。人们对于此处基因组的结构非常陌生,甚至可以说是研究领域的荒野,这里仅发现了少数几个不知名的基因。在遗传学家眼中,这就像是船舶突然搁浅在废弃的滩头,放眼望去却找不到任何可供参考的标志物。

※※※

运用连锁分析确定基因染色体定位相当于从外太空观察地球上的某个大都市:虽然该方法可以让基因定位的精确度得到极大提升,但是距离找到真正的基因仍有很长一段路要走。接下来,我们还需要使用更多的连锁标记物来改进遗传图谱,然后逐步将基因定位至最小的染色体区块中。既往粗犷的遗传学研究方法已经落伍,取而代之的是更为精准的全新手段。

基因定位的最后阶段非常烦冗复杂。携带有可疑罪犯基因的染色体片段将被继续细分成节,当这些染色体片段从人类细胞中分离出来后,它们会被嵌入到酵母菌或细菌的染色体中进行克隆。这些完成克隆的染色体片段将接受测序与分析,然后研究人员会对这些经过测序的片段进行基因扫描,从而确定该片段中是否含有潜在基因。研究人员将不断重复与精炼上述过程,其中每个染色体片段都要接受测序与复验,直到在某段单一DNA片段上识别出候选基因为止。检验的终极环节是对正常人与患者体内的同种基因进行测序,并且以此来确定遗传病患者体内该基因片段是否发生改变,可以说该过程就像是挨家挨户搜捕犯罪嫌疑人。

※※※

1993年2月某个阴冷的早晨,詹姆斯·古塞拉收到一名资深博士后研究员发来的电子邮件,通篇内容言简意赅:“成功了!”而这也意味着此项研究终于瓜熟蒂落。自1983年古塞拉的团队首次将亨廷顿基因定位于4号染色体开始,他与另外58名科学家为了寻找亨廷顿基因顽强拼搏了10年。他们曾经尝试过各种分离基因的捷径,但却总是无功而返。由于在研究早期阶段爆发出的灵感早已耗尽,因此他们只得沮丧地采取逐个基因筛选的传统方法。1992年,他们逐步聚焦于一个最初被命名为IT15(interesting transcript 15)的基因,随后它被重新命名为“亨廷顿基因”。

IT15编码的蛋白质体型巨大,它是一个含有3 144个氨基酸的生化怪兽,其分子量在人体内几乎高居各种蛋白质的榜首(胰岛素仅有51个氨基酸)。就在那个2月的清晨,古塞拉的博士后完成了正常对照组与亨廷顿病患者的IT15基因测序。在统计了测序凝胶中的条带数目后,她发现患者与正常亲属之间存在明显的差别,于是就这样找到了候选基因。

当古塞拉给韦克斯勒打电话的时候,她正准备再次启程前往委内瑞拉采集样本。韦克斯勒在听到这个消息后感到不知所措,激动的泪水抑制不住夺眶而出。她告诉一位记者:“我们成功了,我们成功了。这就是走出黑夜之前需要经历的漫长旅程。”

※※※

尽管亨廷顿基因已经找到,但是其蛋白质的功能仍不为人所知。正常的亨廷顿蛋白质存在于神经元与睾丸组织中,并且大脑在发育时也需要这种蛋白质。然而导致亨廷顿基因发生突变的原因却颇为神秘。正常亨廷顿基因中包含有一段高度重复的DNA序列CAGCAGCAGCAG……而这种单调的重复序列数量平均为17个(某些人为10个,而另一些人可能会达到35个)。亨廷顿病患者体内发现的基因突变十分怪异。镰刀形红细胞贫血症的病因源自蛋白质中的某个氨基酸发生突变,可是在亨廷顿病患者体内,发生突变的部位并不是一两个氨基酸,其原因在于亨廷顿基因重复序列的数量增加,从正常基因中小于35个增长到突变基因中大于40个。重复序列数量增多延长了亨廷顿蛋白的尺寸。此类延长的蛋白质将在神经元中被切割成碎片,并且在细胞内日积月累缠绕成团,这可能是导致细胞死亡与功能障碍的症结。

虽然只是亨廷顿基因中的重复序列的数量发生了改变,但是造成这种奇特“断续”结构的原因却令人百思不得其解。这也许与基因复制时发生的错误有关,DNA复制酶可能在重复序列片段中加入了多余的CAG碱基,就像小孩在拼写单词Mississippi时多写了一个字母s。亨廷顿病在遗传时有一个非常显著的特征叫作“早发”现象:亨廷顿病家族患者体内的重复序列数量将逐代增多,其结果就是致病基因将出现50个或60个重复序列(就像那个出现拼写错误的孩子,还在不停在Mississippi中添加s)。随着致病基因中的重复序列数目与日俱增,亨廷顿病患者的症状将会逐渐加重,同时其家族成员的起病年龄也出现低龄化趋势。研究人员在委内瑞拉甚至发现了年仅12岁的患者,其中某些患者携带的亨廷顿基因含有70个或80个重复序列。

※※※

戴维斯与博特斯坦发明的基因定位技术以其在染色体上的物理位置为基础,而这个后来被称为定位克隆的方法也标志着人类遗传学走入新纪元。1989年,该技术被用于鉴定囊性纤维化(这种严重危害人体健康的疾病可以累及肺、胰腺、胆管以及肠道等器官)的致病基因。尽管导致亨廷顿病的突变基因在人群中非常罕见(在委内瑞拉出现的聚集性患者实属例外),但是引起囊性纤维化的突变基因却较为常见:平均每25个欧洲后裔中就有一人携带这种突变。只具有单个突变基因拷贝的个体并不会出现症状。如果两个无症状携带者结为夫妻,那么他们生下的孩子携带两个突变基因的可能性为四分之一。而遗传两份突变囊性纤维化基因拷贝将会导致患者死亡。此外,某些突变基因的外显率接近100%。截至20世纪80年代,携带两份突变等位基因拷贝的青少年平均寿命为20岁。

几个世纪以来,人们一直怀疑囊性纤维化与盐和分泌物异常有关。1857年,瑞士出版了一本有关儿童歌谣与游戏的年鉴,提醒人们要注意那些“眉毛舔起来有盐味”的儿童的健康问题。患有囊性纤维化的儿童会通过汗腺分泌大量盐分,如果把汗水湿透的衣服搭在金属晾衣绳上,那么其对金属产生的腐蚀作用与海水相仿。由于患者肺部排出的分泌物过于黏稠,因此一口痰咳上不来就可以阻塞呼吸道。此外充满痰液的呼吸道也将成为细菌滋生的温床,并且经常会导致患者出现致命性的肺炎,而这也是患者死因中最常见的并发症之一。囊性纤维化的发展过程非常恐怖,患者的身体将淹没在自己排出的分泌物中,他们最终会以悲惨的结局离开人世。1595年,莱顿大学某位解剖学教授记录了患儿死亡后的情况:“打开心包之后,可以看到心脏漂浮在海绿色的毒液中,直接的死因来自其体内异常肿胀的胰腺……这位可怜的小姑娘非常瘦弱,她的能量被阵发性的持续潮热消耗殆尽。”根据以上描述,我们现在几乎可以断言,他记录的就是囊性纤维化病例。

1985年,在多伦多工作的人类遗传学家徐立之(Lap-Chee Tsui)发现了一个“匿名标记”,而这就是博特斯坦在基因组中发现的DNA变异序列,他发现这个DNA标记与突变的囊性纤维化基因连锁出现。虽然上述标记很快就被定位于7号染色体,但是囊性纤维化基因却仍旧迷失在染色体的荒野中。为了寻找囊性纤维化基因,徐立之开始逐步缩小可能的目标区域。随后,密歇根大学的人类遗传学家弗朗西斯·柯林斯(Francis Collins)与同样来自多伦多的杰克·赖尔登(Jack Riordan)也加入了这场围猎。柯林斯对标准基因捕获技术进行了巧妙的改进。以往在进行基因定位时,研究人员通常采用的是染色体“步移”法,也就是按照先后顺序与重叠情况逐个克隆DNA片段。这种传统方法着实耗时费力,就像人们在攀爬绳索时双手不停地在交替换握。而柯林斯采用了染色体“跳查”法,这样他就可以越过染色体上那些不易被克隆的区段。

到了1989年春季,柯林斯、徐立之与赖尔登已经利用染色体跳查技术将几个候选基因锁定在7号染色体上。他们当下的任务就是进行基因测序与身份识别,然后明确导致囊性纤维化基因功能改变的突变位置。那年夏季,徐立之与柯林斯来到贝塞斯达参加一个关于基因定位的研讨会。虽然当天夜里大雨滂沱,但是他们却默默地守候在传真机旁边,等待柯林斯实验室的博士后将基因测序的结果发过来。随着机器吐出一沓打印有各种晦涩DNA序列(ATGCCGGTC)的纸张,柯林斯终于不负众望找到了囊性纤维化基因:患儿体内持续存在两份突变基因拷贝,而他们未患病的父母仅携带一份突变基因拷贝。

囊性纤维化基因可以编码一种协助电解质跨膜转运的分子。该基因最常出现的突变类型是DNA中出现三个碱基缺失,从而导致蛋白质中某个氨基酸(按照基因语言,DNA上的三个碱基编码一个氨基酸)缺失。上述氨基酸的缺失将造成蛋白质功能障碍,无法实现氯离子(食盐就是由氯化钠组成的)的跨膜转运。由于汗液中的盐不能被重新吸收至体内,因此会出现特征性的高盐汗液。同时人体向肠道分泌电解质与水分的功能也出现异常,进而出现各种腹部症状。 虽然欧洲人中囊性纤维化基因的突变率很高,但是遗传学家对于导致这种情况的原因却困惑了数十年。如果说囊性纤维化是一种致命性疾病,那么为何它没有在进化选择的过程中被淘汰出局呢?最近的研究结果提出了一种颇具争议的理论:霍乱可能会为突变的囊性纤维化基因提供选择性优势。霍乱可以引发患者出现严重的难治性腹泻,并且导致其出现急性水、电解质丢失,而上述改变又将使患者出现脱水、代谢紊乱甚至死亡。对于仅携带一份突变囊性纤维化基因拷贝的霍乱患者来说,其体内水、电解质跨膜丢失的程度相对较轻,并且可以缓解那些严重并发症的程度(可以通过转基因小鼠证实)。该研究证实,基因突变对人体产生的影响具有双面性与条件性的特点,其中携带一个拷贝可以起到积极作用,而出现两个拷贝将导致患者死亡。根据以上研究结果,携带一份突变囊性纤维化基因的个体可能会在欧洲霍乱流行期间幸免患病。当这样的两个个体结合后,他们的孩子出现囊性纤维化(携带两份突变基因)的概率为四分之一。然而即便如此,选择性优势已经足以使突变囊性纤维化基因在人群中延续下去。

对人类遗传学家来说,成功克隆囊性纤维化基因具有划时代的意义。几个月之后,用于检测突变等位基因的诊断试验就闪亮登场了。到了20世纪90年代早期,人们不仅可以对携带者进行突变基因筛查,还可以对子宫内的胎儿进行常规诊断,而这也让父母有机会考虑是否为受累的胎儿实施人工流产,或者能够从孩子身上发现早期囊性纤维化的临床表现。由于“携带者夫妻”的父母都拥有至少一份突变基因拷贝,因此他们可以选择不生育或者考虑领养子女。在过去10年间,随着针对父母的靶向筛查与胚胎诊断得到联合应用,对于那些突变等位基因出现频率最高的人群来说,其先天性囊性纤维化的发病率降低了大约30%~40%。1993年,纽约某家医院开展了为阿什肯纳兹犹太人筛查三种遗传病的大胆研究,其中就包括囊性纤维化、戈谢病与泰伊—萨克斯二氏病(这三种基因在阿什肯纳兹犹太人群中具有较高的突变率)。父母可以选择是否进行筛查,或者为明确产前诊断而进行羊膜穿刺,以及在发现胎儿受累的情况下终止妊娠。自该项目实施以来,以上三种遗传病就在这家医院出生的新生儿中绝迹。

※※※

1971年,伯格与杰克逊构建了第一个重组DNA分子。到了1993年,人们成功分离出亨廷顿基因。现在我们非常有必要将在此期间遗传学实现的转换进行系统梳理。尽管在20世纪50年代末期,DNA已经被确认是遗传学的“主控分子”,但是当时却没有任何手段可以对它进行测序、合成、改变或操作。除了为数不多的几个知名案例以外,人类疾病的遗传基础在很大程度上仍是一个未知数。当时致病基因被明确定位的人类疾病只有寥寥几种,其中就包括镰刀形红细胞贫血症、地中海贫血以及B型血友病。而当时临床上唯一可行的遗传学干预手段就是羊膜穿刺与人工流产。虽然科学家已经从猪内脏与人血中分离出胰岛素与凝血因子,但是没有人能利用基因工程制造出治疗疾病的药物。人类基因从来不会主动在人类细胞以外的地方进行表达。为了实现改变生物体基因组的目的,人们可以采用引入外源基因或者使内源基因发生突变的方法,而它们产生的影响要远远超出任何其他技术所能达到的范围。如果我们查阅那个年代出版的牛津词典,那么根本找不到“生物技术”一词。

仅仅20年之后,遗传学就发生了巨大的变化:人类已经实现了基因的定位、分离、测序、合成、克隆与重组。与此同时,基因还可以进入细菌细胞与病毒基因组,并且用于生产治疗疾病的药物。就像物理学家与历史学家伊夫林·福克斯·凯勒(Evelyn Fox Keller)所说描述的那样:一旦“分子生物学家(发现)可以让他们操纵(DNA)的技术”,那么他们就会“总结出某种专业知识,并且彻底改变我们认为‘先天’永恒不变的历史观”。

“传统观点认为,‘先天’来自遗传,而‘后天’在于培养。现在看来二者的角色可以发生互换……对我们来说,控制前者(即基因)比控制后者(即环境)更为简单,并且可以让这些遥不可及的目标变得近在咫尺。”

1969年,就在遗传学发生巨大变革的10年到来前夕,遗传学家罗伯特·辛斯海默发表了一篇关于未来的随笔。他认为掌握合成、测序与操纵基因的能力开启了“人类历史上的新纪元”。

“有些人可能会嘲笑这种说法,他们或许觉得这不过是当年制造完美人类的旧梦重温。尽管终极目标的确如此,但是其内涵已经日渐丰满。旧梦中的完美人类总是受限于自身与生俱来的缺陷与瑕疵……我们现在发现了另外一种捷径,也可以说是一种千载难逢的机遇,能够让人类超越20亿年来生物进化所创造的奇迹,然后创造出梦寐以求的完美世界。”

然而也有科学家在展望这场生物学革命时并没有表现得那么乐观。1923年,遗传学家J. B. S.霍尔丹曾经说过,只要人类掌握了控制基因的能力,那么“所有信仰、价值观以及制度都将岌岌可危”。