上QQ阅读APP看书,第一时间看更新
第四节 结核分枝杆菌全基因组测序的应用价值
全基因组测序从最初的科学研究高端技术发展为日常应用技术,在结核病研究领域已经有了很多应用,从这些应用回答的问题可以看出,全基因组测序技术在结核病领域的应用范围越来越广。
一、单核苷酸多态性(single nucleotide polymorphism,SNP)研究
SNP是指不同个体的基因组上单个核苷酸的变异,包括替换、缺失和插入。SNP在基因组中分布相当广泛,一般来说,SNP是指变异频率大于1%的单核苷酸变异。SNP可以作为新的遗传标记,人体许多表型差异、对药物或疾病的易感性等等都可能与SNP有关。研究SNP是人类基因组计划走向应用的重要一环,因为SNP将提供一个强有力的工具,用于高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等。
我国的科学家也借助全基因组测序发现新的耐药相关基因。方法对中国161株结核分枝杆菌进行了全基因组测序,包括44株敏感菌株、94株MDR株和23株XDR株。为了筛选与耐药相关的基因,排除了与系统进化相关的SNPs和同义SNPs,结果在7937个非同义SNPs中筛选到了33个与耐药相关的SNPs,85个与耐药相关的基因;在1562个基因间隔区(IGR)SNPs中筛选到了32个与耐药相关的IGR,16个与耐药相关的IGR SNPs。此研究中筛选到的大部分耐药相关基因的功能未知,有待于进一步研究;另外关于IGR在结核分枝杆菌耐药中的作用研究较少,因此提示需要给予IGR更多的关注。基于非同义SNP对于同义SNP的dN/dS率,此研究发现的耐药相关基因几乎涵盖了结核分枝杆菌在药物压力下产生的全部重要的非同义SNP。
日本的科学家通过对一株筛选出的具有很强的传播能力的分枝杆菌临床分离株OMV02_005进行了全基因组测序,希望与其他已知全基因组序列的结核分枝杆菌株作对比,发现基因组中与细菌传播有关的基因。在这个过程中发现了一些OM-V02_005特有的SNPS,但这些SNPS与传播的关系仍有待验证。
二、转录组及表达谱分析
基因表达谱(gene expression profile)指细胞在特定的条件下表达的所有基因。分析基因表达谱是了解组织或器官行使功能的分子基础及环境和病变影响生物的分子机制等的重要手段。以往的基因表达谱分析主要依靠基因芯片技术,该技术需要依赖已知的基因序列来设计探针,通过荧光标记和杂交,根据荧光的强度计算表达量的多少,误差较大,而且无法检测未知基因的表达量。第二代测序技术可对单个细胞样品中的所有RNA即整个转录组进行整体测序,对每个细胞中表达1~50 000个拷贝mRNA的基因都能够检测,该技术还可以检测以前没发现过的基因或新的转录本(transcript),定量测定基因的表达模式。
Nalpas等同时应用全细胞范围内的RNA序列测定(RNA-seq)与芯片比较受牛结核分枝杆菌感染的巨噬细胞与未受感染的巨噬细胞基因表达谱的变化,发现RNA-seq较芯片能够发现更多的有表达差异的基因;感染了牛分枝杆菌的巨噬细胞与未感染细胞的基因表达谱存在差异的基因,集中于免疫、凋亡和信号传导有关的基因。
三、小分子RNA(miRNA)研究
第二代测序技术被广泛应用于小分子RNA(microRNA,miRNA)或非编码RNA (ncRNA)表达研究。非编码的小分子RNA参与了许多重要的生物发育过程。它们的序列长度很短,只有18~40个核苷酸,正好在新一代高通量测序技术的读长范围内。第二代测序方法还能发现新的小分子RNA。miRNA在结核病领域的研究才刚刚开始,最初通过克隆和计算机预测方法发现SiRNA,每次仅能发现几个到几十个miRNAme,而全基因组测序技术RNA-seq则能从细菌整体水平发现miRNA。Pellin和Miotto分别通过RNA-seq一次发现上千个miRNA,所不同的是由于判定标准的不同,可能可靠的程度有所差异。
四、DNA与蛋白相互作用的研究
染色质免疫共沉淀(chromatin immunoprecipitation,CHIP)技术是研究体内蛋白质与DNA之间相互作用的强有力工具,在转录因子结合位点或蛋白特异性修饰位点的研究中被广泛应用。以往的研究CHIP需要与芯片技术结合使用(即ChIP on chip或ChIP chip),但由于芯片技术是基于杂交原理,需根据已知的序列设计探针,对于未知的序列无能为力。将ChIP技术和第二代测序技术结合,即染色质免疫共沉淀测序(chromatin immunoprecipitation sequencing,CHIP Seq)技术充分结合了CHIP和高通量测序技术的优势,能够在全基因组范围内高效地研究目的蛋白的结合位点,可以在基因组水平上很方便的检测某种蛋白所结合的DNA序列,由此全面了解蛋白与DNA的相互作用。
一般认为,对缺氧的适应性与结核分枝杆菌的致病性有重要关系,也与细菌的休眠特性有关。Galagan等人借助CHIP-Seq技术从全细胞水平了解了缺氧-再给氧状态下结核分枝杆菌的基因调控网络的变化,比较了细菌的mRNA、蛋白、代谢物、脂质等重要成分在2个横断面的差异。研究发现,脂质代谢以及细胞壁脂质的合成,是细菌应对缺氧的重要反应;而当缺氧状态的细菌重新获得氧气时,细菌脂质成分的变化也最为明显,而相关的基因处于高水平表达,相应的代谢通路表现最为活跃。这些研究结果对于了解结核分枝杆菌发生休眠的机制有重要的价值。
五、比较基因组学用于药物靶位的预测
对于新的抗结核药物的筛选,传统的方法一般起始于体外的化合物抗菌活性的随机筛选,是一个需要投入很高的人力物力财力的过程。全基因组测序的发展使得利用基因序列推测蛋白结构,并由蛋白结构推定可能有效的药物成为可能。这种新的药物筛选途径回避了一些分枝杆菌生长缓慢或难于培养的难题。比如溃疡分枝杆菌对常用的抗结核药物天然耐药,而溃疡分枝杆菌生长非常缓慢,使得传统的药物筛选很难实现。通过比较基因组学,可以确定病原菌的必需基因,筛选其中与人类没有同源性的基因作为药物研发的靶位,之后通过预测蛋白结构,确定重要的蛋白功能活性区域,再针对性设计化合物,从而大大提高了药物筛选的效率。
六、用于传染源追踪
虽然基因分型技术如VNRTR技术和RFLP技术是使用最为广泛的传染源追踪技术,然而由于这些技术针对的是基因组中有限的基因序列,实际上仍然属于粗略的鉴定方法。全基因组测序技术的发展,使得利用其进行传染源追踪成为可能。Wilson对加拿大一社区3年内发现的48例结核病患者进行传染源追踪和社会网络调查(social network analysis)。他先对来自37位患者的阳性培养物进行基因分型(24位点VNTR,RFLP),结果显示基因型相同,但由于此地区自1955年以来偶发的结核病患者的分离株也显示为同一基因型,因此无法肯定地认为这些病例存在着流行病学联系。为了对传播进行高分辨率的动态分析,对其中36株分离株进行了全基因组测序。SNPs分析显示41菌群来自2个谱系。由此表明:传统的分子流行病学技术的分辨率有限,有时会造成错误的结果。鉴于测序技术的不断发展和价格不断降低,全基因组测序有望用于日常的流行病学研究。
英国的一所学校也利用全基因组测序技术确定了2个表面上看不存在流行病学病例间的联系。该学校同时发现2个结核病例(1位患者来自韩国,1位来自日本),未发现二者间存在流行病学联系,并且来自2位患者的菌株的耐药谱不同。24点MIRU-VNTR鉴定为同一型。在这种情况下,很难确定这2个病例是否源于同一个传染源。通过对来自2位患者的临床分离株的全基因组测序测定,最终证实为同一株结核分枝杆菌。然而,全基因组测序虽然可用于传染源追踪,但相对于疾病传播结核分枝杆菌基因组进化非常缓慢[约0.39SNPs/(基因组·年)],因此不利于对近期传播的追踪。
全基因组序列测定作为一种有效的手段,已经涉及结核病多个研究领域,依靠这个工具已经对结核病领域中的多个问题进行了阐明,促进了结核病研究的发展。相信未来结核分枝杆菌全基因组测序技术能够为更多科研、临床问题的解决提供至关重要的遗传学证据。
(黄海荣)