耐药结核病学
上QQ阅读APP看书,第一时间看更新

第二节 结核分枝杆菌种内基因组的比较

随着大量结核分枝杆菌全基因组信息的获得,深化了人类对于该细菌的了解。目前全基因组测序工作在分枝杆菌领域已经从不同的角度广泛开展。
一、不同实验室的结核分枝杆菌H37Rv菌株的比较
结核分枝杆菌H37Rv是最常用的实验室标准株,不同实验室使用的标准株究竟是否有完全的可对比性?Ioerger等选取了来自6家不同实验室长期保存使用的H37Rv菌株进行全基因组测序,并与已经公布的H37Rv和H37Ra全基因组序列进行比较,以评估不同来源的H37Rv菌株基因组序列的一致性以及它们从起始菌株异化生长的程度。测序结果发现,不同来源的H37Rv普遍存在5到10个DNA序列的多态性,尤其以SNP形式最为多见。有些H37Rv株还发生了IS6110成分和直接重复序列的丢失,导致应用常用的基因分型技术会在鉴定结果上与标准的H37Rv基因型存在差异。而H37Rv早短期内不断传代就引起IS6110成分的缺失,也再次证实了其在结核分枝杆菌基因进化过程中发挥着重要作用。这项研究结果提示科研工作者,由于所使用的H37Rv在体外仍然存在持续进化,因此不同来源的标准株可能会在某些表型方面存在差异,进而影响到一些实验结果的可对比性。
二、结核分枝杆菌不同标准株之间的比较
除了H37Rv外,CDC1551也是常用的标准株,尤其用于临床分离株的对照株。CDC1551是1995年在美国的一次结核病暴发流行中分离到的临床菌株,研究发现它能引起较高的PPD皮试阳转率和比较强的皮试反应,而且发现由它感染动物比由另外一个临床分离株Erdman株引起的感染程度要强得多。Fleischmann等人(2002)对CDC1551株进行了全基因组序列分析,并与H37Rv进行了全基因组比较。研究结果很出人意料,两个基因组存在明显的差异。比较发现,两个基因组有1075个单核苷酸多态性(SNPs,single nucleotide polymorphisms)差异,大约85%的SNPs分布于编码区。鉴于H37Rv已被在体外培养近一个世纪,因而推测两菌株间很多核苷酸差异可能是由于H37Rv在体外连续传代引起。在所有SNPs中,转换(嘌呤到嘌呤,嘧啶到嘧啶)的数量远远超过颠换(嘌呤到嘧啶,嘧啶到嘌呤),分别为61%和39%。SNPs在基因组中的分布也有很大差别,有4个区域发生率较其他区域明显偏高,比较突出的是PE/PPE家族,表明这些区域可能与细菌的抗原变异或者是与宿主发生反应有关。其他3个SNPs发生率高的基因家族则很可能与细菌的毒力和免疫原性有关。通过全基因组比较还发现:H37Rv有37个CDC1551缺失的插入序列(长度超过10个碱基),这些插入序列中有26个影响开放阅读框,另外11个位于基因之间的序列中;而在CDC1551中发现49个插入序列在H37Rv中并不存在,这些插入序列中有35个影响到开放阅读框,另外14个位于基因之间的序列中。值得关注的是:在这两个不同的菌株中,约有一半的插入或缺失涉及到编码PPE或PE-PGRS家族蛋白的基因。基因组比较发现在两种菌株间只有一种重要的基因组结构重排:phiRv1在两个菌株中的位置分别位于不同的REP13E12家族成员中。CDC1551中有4个拷贝的IS6110,而H37Rv中有16个拷贝。H37Rv16个拷贝的IS6110序列中有4个拷贝缺乏其特征性的3或4碱基直接重复序列,而与其直接相连的序列在CDC1551中已缺失。CDC1551和H37Rv在某些区域所含的基因拷贝数也不相同,如H37Rv编码膜脂蛋白的基因是两个相连的基因Rv2543和Rv2544,二者的序列相似性是87%,而CDC1551除了这相应的两个同源基因外,在两基因之间还插有另外一个基因,同两边的基因的相似性分别为88%和84%。而牛型分枝杆菌基因组同源区域中也有3个脂蛋白基因,在排列方式和序列上都与CDC1551类似。对这三种细菌进行同源性比较发现它们在核苷酸的差异程度上相等,也就是说三者在进化距离上是相等的。种系发生学认为三者都起源于结核分枝杆菌的同一祖先,由于基因复制而产生,但之后的H37Rv发生了基因的缺失。类似的情况还出现在腺苷酸环化酶区域,H37Rv有3个基因前后排列,而CDC1551则有4个基因。通过序列比较发现:H37Rv位于中间的基因实际上是由CDC1551中间的两个基因嵌合而来。牛型分枝杆菌腺苷酸环化酶区域与H37Rv类似。种系发生学研究认为这种嵌合结构是由于基因组发生了缺失-融合事件。因而推测在它们的祖先应该有4个连续基因,而H37Rv和牛型分枝杆菌的嵌合结构应该来自同一缺失-融合事件,表明相对于CDC1551,H37Rv和牛型分枝杆菌应该有共同的祖先。这一结论与从膜脂蛋白基因的研究中得到的结论互相矛盾,说明结核分枝杆菌的遗传变异有着复杂的原因,可能在同一位点会独立发生重组、多个插入-缺失事件。
三、结核分枝杆菌H37Rv与H37Ra的比较
Zheng等通过全基因组测序比较了H37RaATCC25177与已经公布了全基因组序列的结核分枝杆菌H37Rv和结核分枝杆菌CDC1551。H37Ra的全基因组由4 419 977bp组成,较H37Rv长8 445bp。与H37Rv和CDC1551相比,H37Ra共有130个序列改变,包括76 个SNPS、39个插入和15个片段缺失。76个SNPS中有66个SNPS位于32个基因的启动子区或编码区,39个插入中有25个位于基因的启动子区或编码区,而15个片段缺失中有5个位于可能的基因启动子区,另外10个位于基因编码区。H37Ra与H37Rv和CDC1551相比存在序列差异,除了位于通常与毒力、纤联蛋白结合、参与免疫逃逸的细胞表面抗原的多样性有关的PPE/PE-PGRS基因外,也存在于一些参与重要代谢过程的蛋白的编码基因,如与应激反应相关的蛋白(mazG)、脂质合成的转录激活蛋白(phoP)、氨基酸合成(ilvD)、聚酮化合物合成(pks12和nrp),这些序列的改变可能也与H37Ra毒力丧失有关。鉴于H37Ra 与H37Rv起源于同一菌株H37,因此对于H37Ra与H37Rv进行全基因组序列的对比分析有利于发现H37Ra毒性降低的机制,对应研究结核分枝杆菌的毒力有重要意义。这个研究中还有一个有趣的发现,即发现在进化的角度,H37Ra与CDC1551较与H37Rv有更高的同源性,这不仅表明CDC1551在起源上与H37有密切联系,并且H37Ra较H37Rv更好地保持了H37的遗传学特征。
四、不同结核分枝杆菌临床分离株的比较
Cubillos-Ruiz等通过对几种结核分枝杆菌的临床菌株(CDC1551、F11、Haarlem和C)以及实验用菌株(H37Rv和H37Ra)进行基因组比对,获得了关于结核分枝杆菌对宿主适应性机制的新认识。在上述6株菌株中发现的遗传变异并未涉及重大的基因组重排,序列差异大多来自插入序列和PE/PPE基因家族相关缺失和转座事件。对6株结核分枝杆菌基因组比对后,研究人员鉴定出了多态性的分布模式及其频率,指明了传播中的结核分枝杆菌正处于活跃的选择压力下,从而通过基因缺失或失活导致变异的发生。对基因的鉴定也显示出一些菌株特异的多态性,将其数量外推至更多的菌株基因组,可见不同菌株含有限数目的独有的基因组多态性。
五、同一株结核分枝杆菌的不同菌群比较
全基因组测序技术的应用普及除了分析不同的菌种、不同的菌株外,甚至用于同一个菌株中不同的菌群,由此有利于了解菌群中不同细菌的不同进化轨迹。Sun等对处于抗结核药物耐药不同阶段的3名患者的7株结核分枝杆菌临床分离株进行了全基因组测序,重点分析了不同耐药阶段每个样品中耐药基因发生不确定突变(unfixed mutations)的数量,并监测耐药形成以后菌群呈现的最终突变形式。研究获得了结核病患者发生耐药并形成最终的耐药突变形式过程中,菌群的基因型的动态变化,发现在抗生素的压力下,1株分离株可能出现4~5个耐药突变,但最终只有一种耐药突变形式固定下来,这可能是细菌菌群通过进化来形成最合适耐药突变的结果。由此推测尽快诊断结核病并尽快开展有效治疗,可以减少细菌进化成最适合耐药突变的机会。