上QQ阅读APP看书,第一时间看更新
第一节 主要组织相容性复合体的基因结构和遗传特点
一、HLA 复合体的基因结构
HLA 复合体的基因结构非常复杂,显示为群体水平的多态性和个体水平的多基因性。 多态性(polymorphism)指群体中在同一个HLA 基因座位上存在两个以上不同等位基因的现象。 多基因性(polygenicity)指每个个体的基因复合体都是由多个紧密相邻的基因座组成,编码产物具有相同或相似的功能。 HLA 复合体位于人类第6 号染色体的短臂,全长3600kb,共有224 个基因座位,其中128 个为功能性基因,96 个为假基因。 传统上将HLA 复合体的基因分为三个区,即Ⅰ类基因区、Ⅱ类基因区及Ⅲ类基因区。 HLAⅠ类基因区位于复合体远离着丝点一端;Ⅱ类基因区靠近着丝点;Ⅲ类基因区位于Ⅰ类与Ⅱ类基因区之间。 各区基因又分为较早发现的经典基因和较晚发现的非经典基因。 由于经典的Ⅰ类和Ⅱ类基因编码产物的功能明显不同于其他HLA 基因编码产物,近来将HLA 基因分为两种类型:一为经典的Ⅰ类和Ⅱ类基因,其产物富有多态性,可提呈抗原肽给T 细胞,直接参与T 细胞的激活和分化,主要诱导和调控适应性免疫应答;二为免疫功能相关基因,包括非经典的Ⅰ类和Ⅱ类基因以及全部Ⅲ类基因,此类基因不显示或仅显示有限的多态性,不直接提呈抗原肽,主要参与抗原提呈的过程和固有性免疫应答(图6-1)。 除特别注明外,HLA 通常指经典HLA。
图6-1 HLA 复合体的基因结构示意图
(一)经典的HLAⅠ类基因和HLAⅡ类基因
1.经典的HLAⅠ类基因
又称为HLAⅠa 型基因,依顺序包括B、C、A 三个基因座位(见图6-1),仅编码HLAⅠ类分子重链(α 链);HLAⅠ类分子的轻链称为β 2 微球蛋白(β 2microglobulin,β 2m),由第15 号染色体上的非HLA 基因编码。 α 链和β 2m 共同组成HLAⅠ类分子,其主要功能是提呈内源性抗原肽,供CD8 +T 细胞识别。
2.经典的HLAⅡ类基因
结构较为复杂,依顺序由DP、DQ 和DR 三个亚区组成,每一亚区包括至少两个功能基因座位,分别编码HLAⅡ类分子的α 链和β 链(见图6-1)。 α 链和β 链共同组成HLAⅡ类分子,其主要功能是提呈外源性抗原肽,供CD4 +T 细胞识别。
(二)免疫功能相关基因
1.抗原加工相关基因
这些基因位于Ⅱ类基因区,编码产物参与内源性抗原或外源性抗原的加工提呈过程。 主要包括:①蛋白酶体β 亚单位(proteasome subunit beta type,PSMB)基因,编码产物为胞质溶胶中的蛋白酶体β 亚单位(包括PSMB8 和PSMB9),主要参与对内源性抗原的酶解,使之成为适合于HLAⅠ类分子提呈的内源性抗原肽;②抗原加工相关转运物(transporters associated with antigen processing,TAP)基因,包括TAP1 和TAP2 两个基因,编码产物是内质网膜上的TAP 异二聚体分子,参与内源性抗原肽的转运,介导胞质溶胶中的内源性抗原肽进入内质网;③HLA-DM 基因,包括DMA 和DMB 两个基因,编码产物α 和β 两条肽链以非共价键结合组成HLA-DM 分子,主要作用是协助外源性抗原肽与HLAⅡ类分子结合,参与外源性抗原的提呈;④HLA-DO 基因,包括DOA 和DOB 两个基因,编码产物α 和β 两条肽链以非共价键组成HLA-DO 分子,是HLA-DM 行使功能的调节蛋白(见图6-1)。
2.固有免疫应答相关基因
主要包括:①非经典HLAⅠ类基因,又称HLAⅠb 基因,包括HLAⅠ类基因区中 E、 H、 G、 F 等基因座位,其中研究较多的有 E 基因和 G 基因,非经典HLAⅠ类基因编码产物(α 链)与β 2m 组成非经典HLAⅠ类分子。 HLA-E 基因编码产物HLA-E 分子表达于各种组织细胞,在羊膜和滋养层细胞表面高表达;HLA-G 基因编码产物HLA-G 分子主要分布于母胎界面滋养层细胞表面。 HLA-E 分子和HLA-G 分子都是NK 细胞表面活化性受体和抑制性受体的配体,但均与抑制性受体结合的亲和力高,因此均可抑制NK 细胞对自身细胞的杀伤作用,在母胎耐受中发挥重要作用;②MHCⅠ类链相关分子(MHC classⅠchain-related,MⅠC)基因家族:位于Ⅲ类基因区,包括MⅠCA 和MⅠCB 基因等,其编码产物MⅠCA 和MⅠCB 分子在乳腺癌、卵巢癌、胃癌和结肠癌等上皮肿瘤细胞表面高表达,是NK 细胞活化受体识别的配体,有助于NK 细胞杀伤靶细胞;③血清补体成分的编码基因,此类基因属于经典的Ⅲ类基因,包括C4、Bf 和C2 基因。 编码产物是补体组分C4、B 因子和C2 分子(见图6-1)。
二、HLA 复合体的遗传特点
1.多态性
多态性(polymorphism)是群体概念,指一个基因座位在人群中存在两个以上核酸序列不同的等位基因的现象。 这些基因称为复等位基因。 加之HLA 复合体等位基因均为共显性,更增加了人群中HLA 表型的多态性。 对一个个体而言,一个基因座位最多只能有两个等位基因,分别出现在来自父母双方的同源染色体上,两个等位基因相同则此基因座是纯合子,不同则此基因座是杂合子。 因此一个个体通常拥有的经典HLAⅠ类和HLAⅡ类等位基因理论上是6~12 种,数字越小可能性越小,这是因为总的说人类是远亲繁殖的。 HLA 复合体是目前已知人体内多态性最丰富的基因系统。 截至2012 年10 月,已确定的HLA 复合体等位基因总数达8712 个,其中经典的HLAⅠ类基因和HLAⅡ类基因多态性最为丰富(表6-1)。HLA 多态性是自然选择的结果,赋予不同个体提呈抗原的能力不同,使得群体水平的抗病能力因具有弹性而增强。
表6-1 HLA 复合体部分座位的等位基因数(2012 年10 月)
∗包括E、G、MⅠCA、MⅠCB、TAP1/ TAP2、DRB4~DRB9、DOA/DOB、DMA/DMB、C4A、C4B、Bf 和C2 等基因座
2.单倍型遗传
单倍型(haplotype)又称单元型,是指一条染色体上HLA 不同座位等位基因的特定组合。 人体细胞为二倍体细胞,两个单倍型分别来自父母,共同组成个体的基因型。 由于一条染色体上的HLA 各位点的距离很近,很少发生同源染色体间的交换,因此,在遗传过程中HLA 单倍型作为一个完整的遗传单位由亲代传给子代,即为单倍型遗传。 同胞之间二个单倍型完全相同或完全不同的概率各占25%,有一个单倍型相同的概率占50%;亲代和子代之间必然有一个单倍型相同,也只能有一个单倍型相同(图6-2)。 这一遗传特点可作为选择器官移植供者及亲子鉴定的依据。
图6-2 HLA 单倍型遗传示意图
相关链接
HLA 的基因型、表型和单倍型
基因型和表型是遗传学概念,分别表示个体所具有的基因类型和所编码蛋白产物的类型。 具体讲,HLA 基因在体细胞两条染色体上的组合称为HLA 基因型;HLA 抗原分子在体细胞上表达的抗原特异性组合称为表型;单倍型是指一条染色体上HLA 不同座位等位基因的特定组合。 因此,HLA 的基因型、表型和单倍型可以理解为分别是从基因水平、蛋白质水平和染色体水平描述HLA 系统的。 不难理解,具有相同HLA 表型和基因型的两个个体,单倍型可以不同。 需要指出的是,由于基因型检测的是核酸序列,表型检测的是抗原特异性,核酸密码子简并性的存在等原因,使不同基因型的个体,表型可以相同。 因此,目前已确定的HLA 血清型(抗原特异性不同)的数量低于等位基因数量。 HLA 血清型的表示方法为基因座后直接写序号,如HLA-B27。 HLA 等位基因的表示方法为:在基因座名后接“∗”号,“∗”号后接4 位数字,如DQB1∗0701,前两位数字代表此等位基因所属主型,后两位数字表示此等位基因在这一主型中的序号,不能读为一个连续的数字。 遗传学规定,基因符号采用斜体,编码产物用正体,如 HLA-A2 和HLA-A2 分别代表基因和所编码分子。 但这一书写规则逐渐被忽视,为简便起见,本章正文一律采用正体。 还要强调的是,很多时候并不需要写明等位基因的名称(基因座∗4 位数),而是基因和编码产物都用血清型表示,如 HLA-A2 和HLA-A2。
3.连锁不平衡
HLA 复合体各等位基因均有其各自的基因频率。 基因频率(gene frequency)指群体中携带某一特定等位基因的个体在群体中的比例。 随机婚配的群体中,在无新突变和自然选择的情况下,基因频率可代代维持不变。 由于HLA 复合体的多基因性,若各座位的等位基因随机组合构成单倍型,则某一单倍型别的出现频率应等于组成该单倍型各基因频率的乘积。 但实际上,HLA 各等位基因并非完全随机地组成单倍型。 例如,在北欧白人中HLA-A1 和HLA-B8 频率分别为0.17 和0.11。 若随机组合,则单倍型A1-B8 的预期频率应为0.17×0.11=0.019。 但实际所测得的A1-B8 单倍型频率是0.088,远远高于预期频率,这种某些基因比其他基因能更多或更少地连锁在一起的现象被称为连锁不平衡(linkage disequilibrium)。 其产生机制和意义目前尚不完全清楚。 可能的机制与某些单倍型有利于个体抵抗某些疾病,从而在自然选择过程中得以存续有关。 连锁不平衡现象在一定程度上限制了群体中HLA 单倍型的多样性,给器官移植寻找HLA 相匹配的移植物供者提供了机会;连锁不平衡可作为种群的遗传标志用于追溯种群的迁移与进化规律;连锁不平衡还可用于对相关疾病的发病机制、诊断和防治开展研究。