第二节 连接酶
连接酶是能催化两个核酸分子连接成一个分子或把一个核酸分子的首尾相连接的酶,此反应与ATP的分解反应相偶联。
一、连接酶连接作用的分子机理
连接酶(ligase)旧称“合成酶”,是1967年在三个实验室同时发现的,最初发现于大肠杆菌中。它是一种封闭DNA链上缺口酶,借助ATP或NAD水解提供的能量催化DNA链的5′-磷酸基与另一DNA链的3′-OH生成磷酸二酯键。但这两条链必须是与同一条互补链配对结合的(T4 DNA连接酶除外),而且必须是两条紧邻DNA链才能被DNA连接酶催化成磷酸二酯键。常用的DNA连接酶有来自大肠杆菌的DNA连接酶和来自噬菌体的T4 DNA连接酶两种,二者的作用机理类似。
T4 DNA连接酶作用过程分三步:第一步,T4 DNA连接酶与辅助因子ATP形成酶-AMP复合物;第二步,酶-AMP复合物结合到具有5′-磷酸基和3′-OH切口的DNA上,使DNA腺苷化;第三步,产生一个新的磷酸二酯键,把缺口封起来,同时释放出AMP。
在生物体内,DNA连接酶在DNA复制、修复和重组中起着重要的作用,连接酶有缺陷的突变株不能进行DNA复制、修复和重组。在基因操作实验中,DNA连接酶主要作用是将由限制性核酸内切酶“剪”出的DNA黏性末端重新连接起来,故也称“基因针线”。
二、连接酶的种类
大肠杆菌DNA连接酶(E.coli DNA ligase)最先是从大肠杆菌细胞中分离纯化得到,是由大肠杆菌染色体DNA编码的相对分子质量为75000的多肽链。它只能催化黏性末端的双链DNA的连接,不能催化平末端双链DNA连接;需要NAD+作为辅助因子,活性较T4 DNA连接酶低,但是其连接背景低,连接更为准确。该酶对胰蛋白酶敏感,可被其水解,水解后形成的小片段仍具有可以催化酶与NAD+(而不是ATP)反应形成酶-AMP中间物的活性,但不能继续将AMP转移到DNA上促进磷酸二酯键的形成。
在大肠杆菌细胞中,约有300个分子的大肠杆菌连接酶,和DNA聚合酶Ⅰ的分子数相近,这也是比较合理的现象。因为DNA连接酶的主要功能就是在DNA聚合酶Ⅰ催化聚合,填满双链DNA上的单链间隙后封闭DNA双链上的缺口。
T4 DNA连接酶(T4 DNA ligase)最早是从T4噬菌体感染的大肠杆菌中纯化而得,是由T4噬菌体DNA编码的相对分子质量为60000的多肽链。它能催化DNA末端的5′-磷酸基与另一个DNA末端的3′-OH连接成磷酸二酯键,在连接反应中以ATP为辅助因子。T4 DNA连接酶不仅可以连接双链DNA,也可以使DNA-RNA和RNA-RNA黏性末端或平头末端进行连接。与大肠杆菌DNA连接酶不同的是,T4 DNA连接酶既能连接黏性末端,也可以连接平端的双链DNA,但是效率比黏性末端低很多。T4 DNA连接酶活性很容易被0.2 mol/L的KCl和精胺抑制,而NH4Cl可以提高大肠杆菌DNA连接酶的催化速率,而对T4 DNA连接酶则无效。需要注意的是,无论T4 DNA连接酶,还是大肠杆菌DNA连接酶都不能催化两条游离的DNA链的末端相连接。T4 DNA连接酶容易制备,活力和连接效率高,所以在分子生物研究中的应用最为广泛。
T4 RNA连接酶(T4 RNA ligase)来源和作用机理与T4 DNA连接酶相同,不同的是其作用的模板是RNA或单链的DNA,是一种ATP-依赖的可以催化单链RNA、单链DNA、单核苷酸分子间或分子内5′-磷酸末端与3′-OH末端之间形成磷酸二酯键的连接酶,连接时需要5′-磷酸基和3′-OH的存在。
T4 RNA连接酶主要用于RNA和RNA之间的连接,不仅可以进行RNA分子间的连接,也可以进行RNA分子(最短8个碱基)的环化连接和tRNA修饰;可以用于RNA和单核苷酸之间的连接,单核苷酸必须为5′和3′均磷酸化的形式,这常用于RNA的3′末端标记;可以用于DNA和RNA之间的连接,当DNA提供5′-磷酸基,RNA提供3′-OH时,连接效率较高,当DNA提供3′-OH,RNA提供5′-磷酸基时,连接效率非常低。此外,T4 RNA连接酶也可以用于DNA和DNA之间的连接,但连接效率非常低,主要用于DNA的环化连接,例如,5′RACE中的cDNA环化。
早期的T4 RNA连接酶是从T4噬菌体感染的大肠杆菌中纯化得到,纯度和活力都较低。目前商品化的T4 RNA连接酶由大肠杆菌重组表达,有些供应商(如NEB)有两种T4 RNA连接酶产品,一种是T4 RNA连接酶Ⅰ(ssRNA连接酶),英文名称为T4 RNA ligaseⅠ(ssRNA ligase),其表达基因的来源为T4噬菌体的T4 RNA连接酶Ⅰ截短型基因,其用途主要用于前面所述的单链模版连接。另外一种T4 RNA连接酶产品是T4 RNA连接酶Ⅱ(T4 RNL2截短型),英文为T4 RNA ligaseⅡ。T4 RNA连接酶Ⅱ可特异性地将DNA或RNA的预腺苷酰化5′末端连接到RNA 3′末端,连接时不需要ATP,但需要预腺苷酰化底物。T4 RNL2截短型的表达基因来自T4 RNA连接酶Ⅱ基因的前249个核苷酸,与全长的T4 RNA连接酶2不同,T4 RNL2截短型不能将底物的5′末端腺苷酰化,无法将RNA或DNA的5′磷酸末端连接到RNA的3′端,因为此酶只能利用腺苷酰化的引物,可以有效地降低连接背景,在基因操作实验中该酶可用于micro RNAs克隆中接头连接的优化。
热稳定DNA连接酶(thermostable DNA ligase)最早是从嗜热高温放线菌(Thermoactinomyces thermophilus)中分离纯化得到的,其在85℃高温下仍能保持连接酶的活性,而且在重复多次升温到94℃之后仍然保持连接酶的活性,所以称为热稳定DNA连接酶。该酶可用于要求高温反应条件的连接反应。目前市场上多种商品化的热稳定连接酶都来源于大肠杆菌重组菌株,但其表达的基因来源于不同的嗜热菌,因此商品的热稳定连接酶都是根据其基因来源的微生物进行命名的,如来源于Thermus filiformis菌株称为Tfi DNA连接酶;来源于Thermus aquaticus HB8菌株的称为Taq DNA连接酶;来源于Thermococcus sp.9°N菌株称为9°NTM DNA连接酶。
热稳定DNA连接酶可以催化磷酸二酯键的形成,使杂交到同一互补靶DNA链上的两条紧邻的寡核苷酸链的5′-磷酸末端和3′-OH末端通过磷酸二酯键连接,相当于对双链DNA分子中的缺口进行连接,活性需要NAD+,其最适反应温度一般在45~65℃,其中9°NTM DNA连接酶基因克隆自极度耐热的海底超嗜热古菌(Thermococcus sp.9°N)——一种发现于北纬9°,2500m深的海底火山口处的嗜热菌,该酶在45~90℃范围内均能保持很高的活性。一般在95℃半衰期超过1 h,在65℃超过50 h,所以其可以用于连接酶链反应(ligase chain reaction,LCR)。
LCR属于一种探针扩增技术,是依赖靶核苷酸序列的寡核苷酸探针的连接技术。这种方法应用4种寡核苷酸探针(即两对互补的引物),当它们在体外结合到靶序列上以后,用耐热DNA连接酶将它们连接起来。
LCR的基本原理是:首先加热至一定温度(94~95℃)使DNA变性,双链打开,然后降温退火(65℃),这时引物与之互补的模板DNA复性退火,如果与靶序列杂交的相邻的寡核苷酸引物与靶序列完全互补只留下一个缺口,DNA连接酶即可连接封闭这一缺口,则LCR反应的三步骤(变性—退火—连接)就能反复进行,每次连接反应的产物又可在下一轮反应中作模板进行再连接反应,从而使目标靶序列得到扩增。若连接处的靶序列有点突变,引物不能与靶序列精确结合,缺口附近核苷酸的空间结构发生变化,连接反应不能进行,也就不能形成连接产物,目标靶序列就没有得到扩增。1991年Backman和Bara-ny分别用耐热DNA连接酶进行了LCR试验,耐热DNA连接酶可以在热循环中保持活性,提高连接反应的特异性,排除了背景扩增和免除了不断补充酶的烦琐程序,使LCR具有了实用性。
LCR反应识别点突变的特异性高于普通的PCR反应,其特异性首先取决于引物与模板的特异性结合,其次是耐热连接酶的特异性。LCR连接反应温度接近引物的Tm,因而识别单核苷酸错配的特异性极高,扩增效率与PCR相当,用耐热连接酶做LCR只用两个温度循环,94℃min变性和65℃复性并连接,循环30次左右就可以进行检测了,其产物的检测也较方便灵敏,可以把扩增产物进行凝胶电泳后放射自显影或者利用酶免疫检测法。LCR作为一种新的DNA体外扩增和检测技术,比PCR具有更高的敏感性和特异性。主要用于点突变的研究与检测、靶基因的扩增、微生物病原体的检测及定向诱变等,还可用于单碱基遗传病多态性及单碱基遗传病的产物诊断,微生物的种型鉴定,癌基因的点突变研究等。
正是LCR反应特异性高于普通的PCR反应,ABI公司的SOLiD第二代高通量测序技术采用LCR技术进行测序反应,也称连接法测序“Sequence by Ligation”。
注意:虽然热稳定连接酶活性是定义为对黏性末端的连接反应,但是其连接反应的特性与其他DNA连接酶(如T4 DNA连接酶)有很大差异(表3-6),用途也不相同,因此不能把热稳定连接酶作为DNA连接酶的替代品。
表3-6 不同连接酶的比较
三、连接酶的单位定义
连接酶单位最早是1968年由Weiss提出的,称为Weiss单位(Weiss Unit),现也称PPi单位。Weiss单位定义为:在37℃下,20 min催化1 nmol/L的32P从焦磷酸根上置换到[γ,β-32P]ATP分子上所需的酶量,现在大多数厂商仍使用这种单位。由于Weiss单位定义中测试的是T4 DNA连接酶中除连接功能外的另一种磷酸基团交换功能,并且测试温度高达37℃,与实际连接反应相比,无论在哪一方面都有一定的差距,于是,1970年Modrich与Lehman提出了真正度量连接功能的d(A-T)环化单位,又称外切酶抗性检测。d(A-T)环化单位的定义为:30℃下30 min将100 nmol/L的d(A-T)(约2 kb长)转化成抗外切酶的形式。
与Weiss单位相比,d(A-T)环化单位更接近实际,但仍有一定的问题,例如,环化单位测试中用的是纯AT片段,与实际连接中4种碱基随机排列不符,再者,如果连接酶将片段连接成多聚体而未环化时,仍可能被外切酶所切,除此之外,与实际上大多数连接反应使用的温度16℃相比,30℃的反应温度仍显得偏高。
为了衡量实际连接条件下的酶活力,NEB公司提出了接近实用条件的黏性末端连接单位(cohesive end ligation unit),也称为NEB单位,其定义为:20μL 1×T4 DNA连接酶反应缓冲液中,16℃反应条件下,30 min能使5′端浓度为0.12μmol/L(约300μg/mL)的经HindⅢ消化的λDNA片段连接上50%所需的酶量。
由于目前Weiss单位和黏性末端连接单位都有厂商在使用,两个单位之间的换算关系为:1 NEB单位=0.015 Weiss单位,或者1 Weiss单位=67 NEB单位。
四、连接酶使用注意事项
在单一DNA分子的连接反应体系中,在连接酶单位定义的底物浓度内,DNA的浓度高,其末端之间的连接概率也高,连接产物量也会上升。在实际的基因操作实验中,连接都是在两个或两个以上的DNA分子间进行的,末端之间就会产生相互的竞争,所以末端的浓度会直接影响到连接产物的分子构型。连接产物的构型有两种:一种是线性的,是由不同的分子间的末端首尾相连接而成的线性DNA分子;另一种是环状的,是由同一个DNA分子或者多个DNA分子连接成大的线性分子,然后进一步首尾末端环化连接而成。
连接产物(重组DNA分子)的分子构型不仅与连接DNA浓度有关,而且与连接DNA分子的长度有关。在一定的浓度范围内,小分子的DNA片段比大分子的容易发生分子内环化,所以在进行质粒的单酶切连接反应中,需要通过去磷酸化处理来防止质粒的自身环化。同样道理,在质粒的连接反应中,两个质粒分子间连接的概率比质粒分子内环化低很多;而长度恒定的DNA分子,降低浓度反而有利于分子的环化。对于重组DNA的连接反应往往是直线性的载体分子和外源的线性分子之间的连接,其希望的目的连接产物是载体分子和单个插入片段的重组子,所以不仅要考虑分子反应体系中总的DNA浓度,也要考虑载体末端和插入片段末端的比例。在一定总DNA浓度的范围内,对于具有相同的黏性末端的载体和插入片段的连接,形成载体和插入片段重组分子的比例会随着插入片段浓度的提高而快速增加,但达到一定的峰值后会缓慢下降。可见要求得到环化的有效连接产物,DNA浓度不可过高,一般不会超过20 nmol/L,如果是线性化的连接产物,DNA的浓度可以高些,至少是接近推荐的浓度。在用大质粒载体进行大片段克隆时,以及在双酶切片段的连接反应中,DNA浓度还应降低,甚至是DNA的总浓度低至几个nmol/L。有研究表明,T4 DNA连接酶对DNA末端的表观Km为1.5 nmol/L,所以,连接时DNA浓度不应低于1 nmol/L,即应具有2 nmol/L的末端浓度。对于质粒性载体,为了降低载体分子间的环化,载体DNA的浓度不宜过高,外源DNA末端的浓度应该大于载体末端浓度的2倍以上;但是对于λ噬菌体载体一类的线性载体,重组子相对分子质量过大或过小都不能被包装,所以期望的连接产物为线性的重组单体杂合分子,这时载体(com的左臂和右臂)和外源片段的可连接末端的比例接近1:1。
载体不同的酶切方式及处理方式,也会影响到连接产物中重组杂合分子的比例。载体用两种内切酶进行酶切处理,其重组杂合率比用单酶切的高;将载体进行回收纯化的重组杂合率比不经过回收的高,单酶切载体经去磷酸化处理的重组杂合率比不进行去磷酸化处理的高。
理论上连接酶最适反应温度为37℃,此时连接酶的活性最高,但是黏性末端的连接中,一般末端都只有4个碱基是互补配对的,在37℃,黏性末端分子形成配对结构的氢键结合不稳定,因此连接反应一般在4~16℃间进行,传统上将连接温度定为16℃,时间为4~16 h。对于一般的黏性末端来说,20℃,30 min就足以取得相当好的连接效果,当然如果时间充裕的话,20℃60 min能使连接反应进行得更完全一些;对于平末端是不用考虑氢键问题的,可使用较高的温度,使酶活力得到更好的发挥。
T4 DNA连接酶活性依赖ATP,反应缓冲液中ATP的浓度在0.5~4 mmol/L之间,较多用1 mmol/L。研究发现,ATP的最适浓度为0.5~1 mmol/L,过浓会抑制反应。例如,5 mmol/L的ATP会完全抑制平末端连接,黏性末端的连接也有10%被抑制,所以一般平末端连接要求的ATP较黏性末端连接的浓度低。此外,在缓冲液中还有DTT,它能提供一定的还原能力。值得注意的是,由于ATP极易分解,含有ATP的缓冲液应于-20℃保存,溶化取用后立即放回冰箱保存。连接缓冲液体积较大时,最好分小管贮存,防止反复冻融引起ATP分解,从而导致连接实验的失败。与限制性内切酶缓冲液不同的是,含ATP的连接缓冲液长期放置后往往失效,所以也可自行配制不含ATP的缓冲液(可长期保存),临用时加入新配制的ATP母液。PEG能提高T4 DNA连接酶的连接效率,所以有些产品会在缓冲液中加入一定浓度的PEG或者附带有专门的含有PEG的缓冲液。
通常在连接反应中使用的DNA浓度比酶单位定义的底物浓度低10~20倍,因此,黏性末端DNA连接的酶用量在0.1单位时就可以达到很好的连接效果。由于大多厂商提供的连接酶浓度往往是高浓度的,从这个意义上讲,常规的黏性末端的连接反应体系中酶量的加入往往是过量的。有些厂商会提供低浓度和高浓度的连接酶产品,进行黏性末端连接时需先行稀释,稀释液的成分与酶保存缓冲液相同或类似,稀释液中的酶能在长时间保持活力,也便于随时取用。平末端的连接效率比黏性末端连接的效率低,所以酶用量要比黏性末端连接大10倍以上,并使用低浓度的ATP,延长连接反应的时间。
在实际的连接实验中,很多因素包括实验操作的因素都会影响到连接的重组率或成功率,相对小片段的连接会比大片段的连接容易,因此很多影响连接成功的因素容易被忽略。在实际的连接实验中也发现5 kb以下载体和3 kb以下的片段相互连接很容易,对于双酶切处理的载体甚至不需要进行回收纯化都可以很容易获得理想连接结果;而大于15 kb以上的载体和外源片段的连接,或者要克隆8 kb以上的片段,连接就会变得十分困难。因此,从某种程度上来说,在遵循原则的条件下,经验的积累比严格按照数据计算来确定连接反应中载体和模板DNA的浓度显得更为有效。实际上离子浓度、EDTA、杂蛋白和存留有活性的酶,特别是去磷酸化酶等影响酶切的因素多会影响到连接的效果,尤其在大片段DNA的连接中,高质量的酶及化学试剂显得更为重要。一些操作也会影响到连接的效果,例如,对载体的回收纯化大多数都是采用琼脂糖凝胶电泳进行,琼脂糖的质量不仅影响到DNA的回收率,而且它含有一些多糖能够和DNA结合,在电泳胶回收时DNA不容易被去除,并会对后续的DNA连接反应产生影响,而且回收的过程对DNA黏性末端也会有损伤。所以对于大片段DNA而言,使用纯度较高的琼脂糖对于后续大片段DNA的连接也是十分重要的。此外,平端的连接对离子浓度很敏感,回收的时候多洗涤,可以采取添加PEG,减少ATP的用量和扩大酶量,22℃连接2 h后再4℃连接过夜,尽可能缩小连接反应的体积(最好不超过10μL,在5~6μL最佳)等措施。