成瘾医学:理论与实践
上QQ阅读APP看书,第一时间看更新

第一节 概述

长期以来,成瘾(addiction)和依赖(dependence)的确切内涵及其差别在成瘾医学的不同学科中一直存在着争论。在相当长一段历史中,人们习惯用“成瘾者”一词来描述使用各种成瘾性物质引起耐受、戒断综合征和强迫性用药及渴求等症状,同时出现社会、职业和家庭功能严重受损的用药者。随着精神活性物质种类的不断增加和对成瘾行为特征认识的不断深入,人们认识到能引起强迫用药和渴求的毒品不一定会出现阿片样的典型耐受和躯体依赖;另外,在某些特殊情况下,即便是阿片类药物,在引起耐受和躯体依赖时,也不一定会引起强迫用药和明显的渴求等行为表现。鉴于此,在1964年WHO曾建议用依赖替代成瘾,理由是依赖可分为躯体依赖和精神依赖,能更准确地界定成瘾药物引起的行为改变。然而,在近几十年里,成瘾一词的应用范围被明显扩大,开始推广用于形容诸如尼古丁等精神活性物质依赖。在由美国精神病学会编著的1968年出版《精神疾病诊断和统计手册》(DSM-Ⅱ)中没有尼古丁成瘾相关内容,在DSM-Ⅲ中才出现了“尼古丁成瘾”这一条目;在由WHO编著的《国际疾病分类》(ICD)一书中也有类似情况。另一方面,在精神依赖描述的范围内,精神依赖存在着明显的程度上的差别,而将其进行程度的区分无论对临床诊断与治疗,还是对其神经生物学机制研究均具有重要意义。这一认识转变是人们对成瘾物质类别、本质及其危害的认识不断深化的结果。著名精神病学家O’Brien认为成瘾的内涵应该是重点强调强迫性用药和严重的渴求状态,而在概念上与躯体依赖不同,因为服用对脑功能具有作用的任何一种药物都可能出现躯体依赖,但未必有强迫性用药的特征。例如,用阿片类药物治疗疼痛,病人会产生躯体依赖,但并不一定会出现强迫性用药,不是成瘾。鉴于以上情况,笔者认为成瘾和依赖的主要区别在于:依赖所涵盖的内容更为广泛,既包括躯体依赖,也包括精神依赖;而成瘾则主要强调的是处于严重阶段的精神依赖。
最近由美国精神病学会编著出版的第五版《精神疾病诊断和统计手册》(DSM-5)把依赖与滥用合并,称之为物质使用障碍(substance use disorder),并将物质相关障碍与非物质相关障碍(行为成瘾)合并,冠以物质相关及成瘾障碍(substance related and addictive disorders),其科学性和合理性如何还有待今后的研究发现和学界的研讨与接受。
一、人类对精神活性物质的认识及应用
在成瘾医学中定义的精神活性物质(psychoactive substances)指的是具有较强的精神活性,能影响情绪、心境、行为以及意识状态,导致机体依赖的所有化学物质的总称,在文献中又常被称之为物质(substance)或药物(drug)等。依据已有的研究结果可把精神活性物质分为3类,即毒品、精神活性药物和其他。毒品一般要具备3个显著的特征,一是具有强大的精神活性、能导致机体成瘾;二是能在社会上被广泛滥用,并引起严重的社会、经济和公共卫生问题;三是与当时、当地的法律、管理规范、文化和社会主流意识相悖。精神活性药物则指的是具有精神活性,能导致机体成瘾,在临床上仍在用于疾病的预防、诊断和治疗的化学物质,如吗啡等。必须指出的是,大多数精神活性药物均具有两重属性,用于医疗目时即为精神活性药物,用于非医疗目时即可转化为毒品。其他指的是那些具有一定精神活性和致成瘾潜能,能在一定程度上引起社会和公共卫生问题,但符合法律规范的化学物质或商品,如香烟和酒等。
人类认识精神活性物质的历史可追溯到近万年以前。根据考古学者的研究,在公元前7000~前5000年,人类就开始了大量葡萄种植,导致葡萄酒的问世。大量葡萄酒的饮用使人们认识到过度饮酒能够成瘾。在公元前3世纪中国人开始采摘和饮用茶叶;南美原住民嚼食古柯叶历史至少可以追溯到公元前2500年。古柯树叶嚼起来是苦的,但为当地的咀嚼者喜爱。他们认为古柯可以使他们增加力量、减轻饥饿感、缓解痛苦。远在公元前4000年的新石器时代,在瑞士屋村遗址中,考古学家便发现了“罂粟”的种子和果实。到公元前3400年,居住在两河流域(今天的伊拉克等国)的人们已经开始大面积地种植“罂粟”,而且给它以“快乐植物”的美名。至少在公元前2160年,阿片已经成为兽药和妇科用药。
那么,人类是怎样发现有些物质具有精神活性呢?原动力是什么呢?概括而言,人类发现精神活性物质与人类的发展和文明进步密切相关,经历了从被动寻找到主动发现这样两个历史过程。在远古,人类群居,靠渔猎为生。随着人类数量的扩大,单纯渔猎已难以为继,人类开始寻找植物的根、茎、叶和果实及种子来扩大能量来源,使人类得以繁衍生存。在这个过程中,人类不但发现了可食用的植物,还发现了能治病的药物和具有精神活性的特殊药物;农业时代的到来,使人类没有必要再依靠寻找新的植物来保证能量供应了,但从植物、矿物和动物中寻找药物和精神活性物质的习惯和技术却保留了下来。在被动找药阶段,人类发现精神活性物质的动力为扩大食物来源,发现精神活性物质是副产品;在主动找药阶段,人类发现精神活性物质的动力是应用驱动的。在历史上,人类把精神活性物质主要用于:①宗教使用;②医用;③作为日用品使用。
(一)宗教使用
千百年来,牧师等神学工作者一直靠食用某些精神活性物质的方法来使之出现一种梦幻感,使之与环境分离,这类物质在当时曾被称作“体内的上帝意志”。4000年来,被称作“毒蝇蕈”的蘑菇在中亚的宗教活动中和古印度宗教活动中一直扮演着重要角色。根据古印度的吠陀经和波斯古经记载,它是一种圣水的主要成分。1869年,人们在毒蝇蕈中发现了胆碱能物质毒蕈碱,认为毒蕈碱具有致幻作用,是毒蝇蕈的活性成分。到后来人们才发现,毒蝇蕈中真正具有致幻作用的不是毒蕈碱,而是蝇蕈醇和鹅膏蕈氨酸。在中美洲,属于裸盖菇属的蘑菇被用于宗教活动。这类蘑菇中含有的精神活性物质是二甲-4-羟色胺和裸盖菇素。前哥伦比亚墨西哥土著人和美国西南部的纳瓦乔人使用一种仙人掌来诱发心灵自省,用于宗教活动。这种仙人掌中含有的活性成分就是大名鼎鼎的麦斯卡林。大麻也有在宗教、灵学的悠久应用历史。特别是在印度,几个世纪来被游荡的“圣人”们所使用。在使用大麻方面更有名的是牙买加的拉斯特法理教(Rastafari)。另有历史学家怀疑古代犹太人、早期基督徒、早期穆斯林苏菲派都使用过大麻。另外有一个武士宗教派别“Hashshashin”其名就来自大麻树脂(hashish)。
(二)医疗用途
在人类有文字记载的早期,某些精神活性物质就已被作为药物用于临床。例如,罂粟类药用就出现在人类最早的文字记载中。公元前900年,在霍默著的《奥德赛》中把罂粟称为忘忧草。描述了它具有缓解疼痛、平息愤怒、忘却烦恼和悲伤的作用。在公元前3000年闪族人开始种植罂粟,并从其未成熟的蒴果中获得了阿片;他们将阿片称作“欢乐”,将罂粟称作“欢乐植物”。公元前1500年,在著名的人类最古老的医学书籍——Ebers草纸书中记述了罂粟具有预防儿童过度哭泣的作用。在19世纪,阿片酊被广泛用于治疗成年人和儿童的多种疾病,如失眠、心脏病和感染等。劳工阶层广泛饮用阿片酊来替代杜松子酒或葡萄酒用于消除疲劳。20世纪早期,在西方的大百科全书中仍然宣称精神和躯体健康的人可以食用阿片,不会引起依赖和成瘾。德国精神病学家、现代精神病学奠基人之一Griesinger曾大力推荐使用阿片来治疗抑郁症。
古柯碱提炼自古柯树,为一种原产于南美安地斯山脉斜坡上的灌木。古柯碱是一种天然的中枢神经兴奋剂,具有局部麻醉作用,其0.03%水溶液即能麻醉感觉神经末梢。对中枢神经有较大的毒性,能使大脑皮质兴奋产生欣快感,这是产生嗜好的原因,反复使用可迅速成瘾,成为一种毒品。古柯碱及其盐酸盐的水溶液在煮沸消毒时分解,现多被其他合成的局部麻醉药所代替。眼科仍常用作黏膜麻醉剂。
(三)作为日用品使用
某些精神活性物质被相当多的人当作重要的日用品使用。例如,酒、烟、茶和咖啡等作为合法的精神活性物质被广泛使用。最古老的用于种植的葡萄种子在美国佐治亚州被发现,时间可追溯到公元前7000~前5000年。根据犹太教和基督教的盛典,诺亚离开方舟后做的第一件事情就是开了一座葡萄园,他喝了自己酿制的葡萄酒,成了一个醉汉。咖啡在公元15世纪末就在伊斯兰世界被广泛使用,并迅速传到欧洲,欧洲人又把咖啡的种植技术传到其所属殖民地。茶叶的历史更悠久,在公元前3世纪中国人就开始采摘茶叶。现在,葡萄、烟草、茶树和咖啡树被大量种植,成为乡村的景致;其产品(酒、烟、茶和咖啡)则被人们日常使用,并成为社交的工具、促进商业往来。
二、对成瘾行为的认识及演变过程
在中世纪罗马法律中,成瘾(addiction)一词被用来描述不能偿还到期的借贷而被强迫罚工抵债这一现象。“addictus”则是指因不能偿还借债而受到约束的人。根据牛津字典的解释,在16世纪初,addict被用来描述自愿成为附属,自愿沉溺于某些习惯,深爱某一事物,偏好某一事物等现象和人。具有现代医学含义的成瘾这个词最早出现于说英语的国家和地区,继之出现在其他语系中,替代了有相似意思的文字。然而,药物成瘾在20世纪以后被广泛应用的医学生物学含义是用来形容沉溺于某一药物的状态,因长时间应用而导致的强迫性用药。当今对药物成瘾一词解释是:①用药模式呈现一种连续的进展过程——从使用、滥用到依赖;②通过激活中脑多巴胺奖赏环路引起欣快,通过引起支配伏隔核、前额叶皮质的谷氨酸系统的代偿性适应引起依赖。
人类除在宗教、医学和日常生活中使用精神活性物质之外,“滥用”也是精神活性物质在社会上使用的一个重要方面。有关精神活性物质滥用问题的描述可以追溯到几千年以前。人们发现亚历山大在公元前323年的死因与酗酒有关。亚里士多德首次描述了酒成瘾的戒断症状,并指出怀孕期间饮酒有害。罗马医生Celsus指出对酒的依赖是一种病。
近代成瘾医学的诞生应归功于加尔文神学者。他们第一次对强迫性饮酒产生的原因作出了解释,并为当时大多数医生所接受。荷兰医生N. Tulp解释了酒精是导致行为失控的原因,把过去认为是罪孽深重的行为给予了医学解释。几十年之后,Tulp的同事之一C. Bontekoe医生利用Tulp的学说进一步解释了饮酒的行为失控。伴随着殖民时代和工业革命的到来及国际贸易的兴起,特别是由于化学的进步,使人们有能力从传统的粗制剂精神活性物质中获得了精神活性更为强大的纯化合物,如从阿片中获取了吗啡。这些进步和随之而出现的用药方式的进步(吸入和注射给药等)使成瘾成了全球的公共卫生问题。在18世纪,由于在中国出现了大量阿片成瘾者和中国政府采取的禁止阿片销售和使用的行动,使人们认识了阿片的成瘾潜能及巨大的危害。在欧洲,酒精成瘾对劳工阶层的健康构成了重大威胁。在那个年代,精神病学已成熟为一门科学,建立了精神疾病分类学。美国医生B. Rush在18世纪就提出自我控制能力丧失是维持强迫性饮酒行为的关键,而导致控制能力丧失的原因则是酒本身,与酒精成瘾者自身无关,这为正确认识成瘾奠定了基础。在19世纪,与成瘾相关的专业杂志纷纷创刊。1876年,《酒瘾杂志》创刊于美国;1884年,《英国成瘾杂志》(即现在的《成瘾》)创刊;曾为现代精神病学建立作出重要贡献的E. Kraepelin医生在19世纪90年代首次发表了有关茶和酒对人体精神行为影响的心理行为测试数据。据此他得出了慢性酒成瘾会引起大脑皮质损伤,导致长期存在的认知功能减退,首次提出了精神活性物质成瘾的生物学基础,开创了人类成瘾生物学基础研究的先河。与Kraepelin同时代的S. Freud为从心理学角度认识成瘾作出了奠基性工作。他在1879年的一封信中写到“现在我感悟到,手淫的本质也是成瘾。只能用新的成瘾来替代它,如酒、吗啡和烟草等”。他的这一描述的意义在于他使人们认识到不同的物质成瘾(阿片、可卡因、烟和酒等)和行为成瘾(赌博和手淫等)均可能具有共同的本质,可以被看作是同一类疾病的不同表型,这为现代成瘾神经生物学机制研究奠定了基础,指明了方向。
三、对成瘾神经生物学机制的认识及演变过程
进入20世纪,成瘾研究内容得到了极大丰富,代表性突破主要体现在成瘾分类诊断学、成瘾神经生物学和成瘾遗传学等研究领域取得的重大进展。
1924年,L. Lewin出版了其颇具影响力的有关成瘾分类的专著。他把成瘾分为刺激性(尼古丁、咖啡因、性交),麻醉性(酒和乙醚),致幻性(麦角酸二乙胺),欣快性(吗啡、可卡因)和安眠性成瘾等5类。这一分类为成瘾临床诊断与治疗奠定了重要基础,为成瘾神经生物学研究指明了方向。
动物实验和临床功能脑成像研究方面取得的研究成果,使人们认识到不同药物所致的成瘾行为具有共同的生物学特征,即成瘾性刺激通过激活奖赏环路,并进一步通过改变脑组织功能与结构,将药物成瘾信号翻译成生物奖赏信号或使脑形成类似食物和性刺激引起的改变而导致成瘾。人们进一步研究发现,与精神活性物质(可卡因等)建立起条件联系的线索和环境能激活大脑皮质和边缘系统。此条件性激活与大脑皮质和谷氨酸系统激活相关。当环境和(或)线索出现时,成瘾机体会出现渴求和控制力下降,使用药行为得以持续或再现(复吸)。上述假说是基于巴甫洛夫的条件反射理论建立的。在这里,精神活性物质相当于食物,渴求相当于唾液分泌,药物线索相当于铃声。在遗传学研究领域,至少在酒成瘾患者中,通过家族和双生遗传学研究证明药物成瘾与遗传因素相关。遗传因素与环境以一种极为复杂的方式相互作用而影响成瘾的发生。

第二节 药物成瘾的神经生物学本质及假说

药物成瘾的行为学特征是强迫性用药和强迫性觅药(长期持续存在的强烈用药动机)。要回答药物成瘾的神经生物学本质,就必须先回答两个最基本的科学问题。一是机体为什么对精神活性物质易感;二是精神活性物质使机体发生了什么样的改变。本节将在回答上述两个问题的基础上,简介药物成瘾的本质及若干有代表性的假说。
一、机体对精神活性物质易感的神经生物学基础
“适者生存”是生物进化的根本法则。在上亿年生物界漫长的进化过程中,生物必须具备一种重要的辨别能力,那就是能够辨别来自体内外的哪些刺激是有利于个体生存和种族延续的,并对这种经验形成较牢固的记忆。机体之所以能在来自体内外众多刺激中准确辨别出有利于个体生存和种族延续的刺激,是因为机体有一套严格的生物学判别标准。凡能使机体产生愉悦和欣快感觉的刺激就是有利于个体生存和种族延续的刺激,如性、美食、运动等;使机体出现的欣快和愉悦的程度越高,那么该刺激对个体生存和种族延续关系就越重要,形成的记忆也就越牢固、越深刻。
机体实现上述辨别和记忆功能的生物学基础是“奖赏环路(reward circuit)”。奖赏环路的构成是位于中脑腹侧被盖区(ventral tegmental area,VTA)内的多巴胺能神经元投射到伏隔核(nucleus accumbens,NAc)、前额叶皮质(prefrontal cortex,PFC)、海马和杏仁核等不同脑区形成的神经环路。此环路参与奖赏效应(愉悦和欣快感),或曰正性强化效应,使机体学会如何获得奖赏刺激,启动并建立用药线索和环境与奖赏的关系,防止奖赏反应过度。在上述奖赏环路中,VTA-NAc通路是形成奖赏效应的最重要通路,尤其是在奖赏效应形成的早期。有利于个体生存和种族延续的刺激均能上调奖赏环路多巴胺系统的功能,使机体产生欣快感和相关记忆。此环路中多巴胺系统功能上调的越高,机体产生的欣快感就越强,形成的记忆就越牢固。
虽然包括毒品在内的精神活性物质的化学结构差别巨大,在体内初始作用的靶点也各不相同,但它们都能像性和美食刺激那样,直接(甲基苯丙胺、可卡因等)或间接(海洛因等)上调奖赏环路的多巴胺系统功能;而它们上调NAc内多巴胺浓度的程度远大于性和食物等生理性奖赏刺激,所产生的记忆也比生理性奖赏刺激牢固得多。换句话说,包括毒品在内的精神活性物质之所以能使机体成瘾,就是因为它们“盗用”了机体固有的奖赏机制,使中脑边缘系统多巴胺水平升高,进而使机体把精神活性物质刺激误认为是有利于个体生存和种族延续的刺激。因此,大多数学者认为,从线虫到人,只要有基本的奖赏环路(VTA-NAc)存在,只要接触精神活性物质时间足够长、量足够大,就都会成瘾。
二、药物成瘾的神经生物学本质——代偿性适应
代偿性适应(adaptation)是机体普遍存在的一种被动适应体内外环境改变的能力。这种能力使机体能在体内外环境发生改变时,正常的生理功能和生化过程得以维持,使生命活动不发生重大改变。例如,当机体由1000m以下海拔高度进入2500m以上海拔高度的高原环境时,低氧就会刺激机体,通过一系列调控机制使靶组织和细胞的基因表达发生改变,使红细胞数量、血红蛋白含量、血红蛋白携带氧分子能力和机体组织器官利用氧能力增加。这一适应性改变能在某种程度上缓解缺氧对机体生理功能和生化过程的影响,使正常生理功能得以维持。目前,大多数学者认为,精神活性物质之所以能使机体成瘾,是因为其在与机体发生长期的相互作用后引起机体发生代偿性适应改变造成的。与上述缺氧引起机体发生的代偿性适应不同的是,由精神活性物质引起的代偿性适应更为复杂,主要发生在中枢神经系统,包括一系列生理功能、生化过程和组织形态学的适应性改变。
精神活性物质所致成瘾的神经生物学机制——代偿性适应的过程包括:①精神活性物质进入体内;②进入体内的精神活性物质和各自的靶分子发生相互作用,进一步改变靶分子(受体、转运体)及相关分子(代谢酶)的功能,产生包括奖赏和正性强化作用在内的急性药理作用,这被认为是成瘾过程的起点;③在精神活性物质与机体发生长期相互作用的基础上,靶系统就会发生受体前神经递质、受体和受体后信号转导水平的代偿性改变;④在精神活性物质与机体发生长期相互作用和(或)上述靶系统的代偿性适应的基础上,非靶系统,如谷氨酸(glutamine)、γ-氨基丁酸(γ-aminobutyric acid,GABA)等系统,也会发生受体前神经递质、受体和受体后信号转导水平的代偿性改变;⑤上述发生在两个系统(靶系统和非靶系统)、三个水平(受体前、受体和受体后)上的代偿性适应导致耐受、躯体依赖、精神依赖和成瘾的发生。在上述五个过程中,除过程一和二外,其他三个过程无论从代偿性适应改变的内容,还是从代偿性适应改变机制上讲,都尚未完全阐明,尤其是第五个过程。
如上所述,要较深入地认识精神活性物质引起的代偿性适应机制,首先要了解精神活性物质急性作用的分子靶位,这是精神活性物质引起代偿性适应的第一步。例如,阿片类物质进入体内后,首先激活位于VTA内的GABA能中间神经元上与G i/o蛋白偶联的μ阿片受体,下调GABA能神经元的功能,使受其调节的多巴胺能神经元脱抑制,而增加其投射靶区NAc等多巴胺的释放,产生奖赏效应。研究发现,μ受体基因敲除小鼠或使用阿片受体阻断药纳洛酮等,阿片类药物既不会引起典型的行为反应,也不会造成躯体依赖和精神依赖反应。可卡因和苯丙胺类兴奋剂都能激活单胺系统,使细胞外多巴胺、5-羟色胺和去甲肾上腺素水平升高,但是作用机制不同。可卡因主要通过阻断多巴胺转运体、5-羟色胺转运体和去甲肾上腺素转运体,抑制单胺类神经递质的重摄取而直接上调细胞外单胺类神经递质浓度,增强单胺类神经递质系统功能;苯丙胺类兴奋剂的作用机制更为复杂,它是囊泡单胺转运体2和细胞质膜的多巴胺转运体、5-羟色胺转运体、去甲肾上腺素转运体的竞争性抑制剂,使神经元囊泡中存贮的单胺类神经递质逆转运至细胞外并抑制细胞外的多巴胺等单胺类神经递质重摄取,另外苯丙胺类兴奋剂还有一定的抑制单胺氧化酶活性的作用。大麻类药物激活G蛋白偶联的1型和2型大麻受体(CB 1与CB 2);酒精易化GABA A受体和抑制NMDA受体功能,也调节5-HT 3受体和烟碱受体及其他受体(因酒精可直接与受体蛋白发生相互作用,它几乎可以影响所有受体的功能);尼古丁激活烟碱型乙酰胆碱受体;麦角二乙胺等致幻剂部分激活5-HT 2A受体;巴比妥类和苯二氮 类激活GABA A受体,从而上调奖赏环路多巴胺功能。综上所述,这些药物在改变各自靶分子功能的基础上都能上调NAc内的多巴胺浓度,从而产生奖赏效应,启动机体成瘾过程。
精神活性物质长期与其各自的靶分子发生上述相互作用后,就会引起靶系统和非靶系统发生代偿性适应。此代偿性适应的生物学基础是精神活性物质通过长期改变靶分子功能引起的分子生物学和细胞生物学改变。
以阿片为例,其在分子水平引起代偿性适应的过程是:首先,阿片通过急性作用,激活靶神经元细胞膜上的μ阿片受体,抑制神经元内腺苷酸环化酶(adenylyl cyclase,AC)活性,降低细胞内cAMP浓度,引起蛋白激酶活性下降,下调细胞内靶分子磷酸化水平,进一步影响细胞内靶蛋白和细胞膜上离子通道功能而发挥抑制性效应,产生镇痛等药理作用。在阿片上述急性作用的基础上,吗啡通过长时间激活阿片受体,过度抑制AC活性,在发挥上述药理作用的同时,还会引起靶细胞内的某些分子,如cAMP反应元件结合蛋白(cAMP-responsive element binding protein,CREB)的表达水平和转录活性上调;后者进入细胞核,使某些转录因子,如核因子-κB(nuclear factor-κB,NF-κB)表达上调;NF-κB进一步通过上调某些与阿片受体信号转导功能相关的重要分子的表达,而对抗吗啡引起的AC抑制效应,从而实现阿片受体作用系统(靶系统)在受体前、受体和受体后的代偿性适应改变。此外,阿片通过激活阿片受体,间接上调VTA多巴胺能神经元功能,也会通过如上所述的分子机制引起多巴胺系统(非靶系统)发生受体前、受体和受体后的代偿性适应改变。上述改变最终导致神经元的结构、功能和生化过程发生可塑性改变,构成了特定的代偿性适应的发生。
细胞水平的代偿性适应的主要神经生物学过程表现为,在精神活性物质长期作用下,在上述分子水平代偿性适应改变的基础上,神经元突触结构和突触传递功能发生了改变。哺乳动物神经系统的结构和功能对内、外因素的改变具有易变化性和可修饰性,这是神经系统的重要特征之一。神经系统具有通过调节神经元的内在特性和突触连接的能力来适应环境变化的特性,称此为神经可塑性(neuroplasticity),被认为是形成新的神经系统功能(如学习记忆)的神经生物学基础。精神活性物质的长期作用能够诱导突触在结构和功能方面发生适应性变化,即突触可塑性变化。在结构方面,长期使用精神活性物质能够使PFC、NAc等脑区的树突棘密度发生改变,甚至引起神经元的形态和大小改变;在功能方面,长期使用精神活性物质能够影响突触传递的长时程增强(long-term potentiation,LTP)和长时程抑制(long-term depression,LTD)。这种突触结构和功能的持久改变,是驱动成瘾行为的细胞学基础。值得注意的是,虽然长期使用精神活性物质能够诱导突触可塑性的持久性改变,但是这种改变并非不可逆,随着戒断时间的延长有可能恢复。因此,突触可塑性改变尚不能很好地解释药物成瘾形成的能持续几年、甚至几十年的长时程记忆。
三、与药物成瘾机制相关的重要假说
药物成瘾的神经生物学机制非常复杂、尚未完全阐明,用于解释药物成瘾机制的代表性假说主要有以下几种。
(一)正性强化假说(positive reinforcement hypothesis)
精神活性物质具有改善情绪的作用,使用这些物质后往往会产生一种无法用语言表述的欣快感,使用者为了不断感受这种美好的感觉而追求再次使用药物,此作用被称为精神活性物质的正性强化效应。Wise和Bozarth据此提出了正性强化假说,也被称为同向过程假说。此假说认为,药物成瘾(强迫性用药和强迫性觅药)是由于药物带来欣快感的正性强化作用所致,机体为追求正性强化效应而倾向于持续用药,导致成瘾的发生。该假说能够较好地解释成瘾者初期的用药行为,但是不能解释为什么在成瘾后期,用药后药物所致的欣快感(奖赏效应)已减弱或消失,而用药行为仍然维持;也无法解释用药相关环境以及不能引起主观效应的小剂量药物所导致的复吸等药物成瘾重要的行为特征。
(二)负性强化假说(negative reinforcement hypothesis)
早期的负性强化假说是基于对阿片成瘾者的临床观察提出的,认为驱动反复用药行为的主要原因是为了避免突然撤药时难以忍受的戒断症状。随后Solomon于20世纪70年代提出反向过程假说,Koob解释了其神经机制并发展了该假说(彩图3-1)。该假说认为,精神活性物质作用机体后,首先引起一个a过程(激活脑内奖赏环路),使机体产生欣快感;继之,a过程又反过来启动一个b过程(长期奖赏环路激活使VTA-NAc通路的多巴胺功能下调),使机体产生负性感受。b过程的生物学意义在于它有助于机体恢复内环境稳态,促使中枢神经系统功能恢复生理状态。a过程和b过程的总和决定个体对精神活性物质作用的主观感受——欣快或负性感受。在用药初期,a过程往往大于b过程,个体主观体验的是欣快的A状态;反复用药后a过程逐渐减弱而b过程逐渐加强,个体体验的是负性的戒断状态(B状态)。为了避免负性状态是个体不断使用药物的基本动机。随后又对该假说做了修正,认为b过程引发的B状态不仅包括躯体戒断症状,还包括负性情感状态,这种负性情感状态是导致持续用药和复吸的主要因素;另外还增加了对条件性b过程的解释。这些认识上的进展,扩大了负性强化假说的应用范围,使之不仅可以用于解释阿片类毒品成瘾,亦可用于解释其他类型毒品成瘾的行为学机制。近年来,Koob借鉴稳态应激(allostasis)理论,进一步发展了负性强化假说。他认为从用药到成瘾的转变是一个螺旋式进行性的负性应激过程,每次用药都重复“先占/期待(preoccupation/anticipation)、狂饮/陶醉(binge/intoxication)、戒断/负性情感(withdrawal/negative affect)”这一a-b转换过程。最初的用药对机体内环境稳态造成破坏,机体调整各项生理参数以适应药物的刺激,维持稳态;反复用药b过程逐渐增强,机体原来的稳态已不能维持、建立了新的稳态,使稳态“调定点”逐渐降低,形成一个反复丧失自我控制的恶性循环,导致成瘾行为。负性强化假说在解释药物成瘾机制中占有重要地位。
(三)动机-敏化假说(incentive-sensitization hypothesis)
动机-敏化假说由Robinson和Berridge在1993年提出,后来在2008年做了修改。该假说认为,成瘾性物质长期作用引起中脑边缘皮质多巴胺系统功能发生适应性改变,使得该系统对药物及药物相关的刺激变得高度敏感,这一现象被称为敏化(sensitization)。敏化的结果使与药物有关的刺激被赋予了动机凸显(incentive salience)的亚奖赏成分,使机体对药物相关线索的刺激变得异常敏感,反应性显著增强,构成了强迫性觅药用药及复吸的主要驱动力。该假说用“喜欢”(liking)和“想要”(wanting)来区分药物所致的欣快感和动机凸显。成瘾早期产生的正性强化作用主要表现为长期用药并不能使与“喜欢”或欣快感有关的神经系统敏化、甚至导致耐受(见负性强化学说);在成瘾过程的后期,由于奖赏环路和其他相关神经环路代偿性适应的结果,使与“想要”或动机凸显有关的神经系统敏化,导致越来越“想要”,进而出现渴求,在行为上表现为强迫性用药和强迫性觅药。该假说较好地解释了为什么不能引起主观效应的小剂量药物能引起复吸,以及即使长期戒断数年、甚至数十年后再次接触药物相关线索也会导致复吸等现象。正因为如此,动机敏化假说在成瘾研究中影响广泛,地位重要。
图3-1 药物成瘾的恶性循环及负性强化假说示意图
(四)异常学习记忆假说(aberrant learning and memory hypothesis)
近年来的研究表明,药物成瘾与学习记忆之间具有密切关系,成瘾与学习记忆具有相似的神经环路,依赖于一些共同的神经生物学机制。这些共同的机制至少包括某些共同的细胞内信号转导过程和表观遗传学机制;药物成瘾与生理性学习记忆都伴随着相似的神经元形态的适应性改变和脑内突触可塑性的改变,并能持久地改变行为。然而,在行为学上我们又能清楚地看到成瘾机体对药物成瘾的记忆比生理性学习记忆牢固得多、深刻得多。实验发现,用巧克力和可卡因分别对大鼠进行自身给药训练,经不同的戒断时间后,以条件线索是否能引起复吸行为作为指标,判断大鼠对两种刺激的记忆时间。实验结果发现大鼠对巧克力相关线索的记忆仅是对可卡因的记忆的1/10~1/5。因此,有学者提出了成瘾的异常学习记忆假说。该假说认为,药物成瘾是由异常学习所建立的一种顽固的刺激-反应习惯,联合型学习在其中起重要作用。联合型学习是机体获得外部环境中不同刺激之间或者外部环境刺激与自身行为之间的联系的过程,建立此联系过程的机制包括经典条件反射和操作性条件反射。药物成瘾的联合型学习主要包括行动与结果(action-outcome,A-O)、刺激与反应(stimulus-response,S-R)和刺激-刺激(stimulus-stimulus,S-S)之间的联系,并通过以下形式贯穿于成瘾行为中。①通过简单的经典条件反射的原理,使动物建立起药物和用药线索/环境之间的联系(S-S),即自动形成过程,这是一种刺激-奖赏学习过程,进而使成瘾动物产生趋近反应(approaching response),导致机体主动接近与药物相联系的条件性线索和环境;②反复的药物奖赏性刺激,可通过刺激动机或目标产生的强化作用引起操作性行为(A-O),如自身给药行为;③药物相关线索与觅药行为联系(S-R)的逐渐巩固和加强,最终诱导习惯性行为的产生;④在长时间戒断后,再次出现药物相关线索可通过早前联合型学习获得的深刻记忆诱发复吸。该假说较好地解释了强迫性用药产生的机制和长期戒断后用药线索和用药环境导致复吸的实验和临床现象;另外,对动机-敏化假说提供了较好的解释(刺激-刺激联系学习可能促成了动机系统敏化的形成)。
(五)认知功能障碍假说(cognitive dysfunction hypothesis)
药物成瘾者不仅对药物有病理性渴求,而且在寻找药物的过程中表现出非理性的行为。临床研究发现,药物成瘾者存在注意力缺陷、工作记忆能力降低、决策障碍、冲动控制障碍,总体表现为执行控制能力缺失的认知功能障碍。因此,有学者提出了认知功能障碍假说。该假说认为,药物成瘾者认知功能障碍的神经生物学基础是在药物长期作用下前额叶皮质功能出现了异常,使成瘾者对药物相关线索产生过度的注意力偏好,并且明知药物带来的严重后果仍然不可控制地觅药和用药。药物成瘾与认知功能障碍互为因果。一方面,高冲动性、注意力缺陷的个体更容易发生药物成瘾;另一方面,长期药物作用引起药物成瘾者注意力、决策、冲动控制等认知功能障碍,而这些功能障碍又促进复吸,继续用药又会导致认知功能破坏进一步加深,如此恶性循环导致强迫性用药和觅药行为的出现和维持。基于认知功能障碍假说,采用心理行为干预改善成瘾者认知功能已被应用于药物成瘾(特别是苯丙胺类兴奋剂成瘾)的治疗中。
(六)习惯性行为假说(habitual behavior hypothesis)
行为心理学研究发现,机体的行为可分为目的性行为(goal-directed behavior)和习惯性行为(habitual behavior)。目的性行为是习惯性行为的基础,由目的驱动;这类行为不稳定,受意识控制。当行为所导致的结果不能实现时,目的性行为即逐渐减弱或消失。习惯性行为则是机体在长期目的性行为实践过程中学会的一种新的行为能力,由习惯驱动。当遇到与习惯性行为相关的情景时,不用上升为意识就会完成相应的行为动作。习惯性行为相对稳定,具有自动化特征。目的性行为转化为习惯性行为是生物进化过程中获得的一种重要能力,使机体能够更快速地对环境变化作出正确反应。在成瘾研究中人们发现,药物成瘾是一个连续的病理生理学过程。从行为学角度来讲,药物成瘾一般表现为由偶然用药、规律性用药发展为强迫性用药。规律性用药和强迫性用药分别与目的性行为和习惯性行为极为相似,因此Everitt等提出了药物成瘾的习惯性行为假说。该假说认为,规律性用药出现在成瘾早期,用药目的是为了追求奖赏效应(欣快感),属于目的性行为;当停止用药后,觅药行为不能得到药物,即行为目的不能实现时,行为相对容易消退。此行为表现为用药量和用药过程在一定程度上受意识控制,戒断后复吸主要由渴求引起,神经生物学基础是NAc功能的上调。强迫性用药则不然,它出现在长期规律用药的基础上,用药行为是由习惯驱动的,属于习惯性行为;主要表现为用药量不能控制,出现不计后果的用药,用药行为难以戒除。复吸主要由与用药行为相关联的情景和线索引起,受意识控制较弱。强迫性用药是药物成瘾的核心行为特征,是成瘾难以戒除、产生严重的个体和社会危害的主要原因。强迫性用药的神经生物学机制可能与长期规律性用药引起NAc活化向背侧纹状体转移和源于前额叶皮质和运动皮质的谷氨酸能支配背侧纹状体功能上调相关。习惯性行为假说虽然提出的时间不长,却引起了学界的高度重视,被认为可能开辟了药物成瘾神经生物学机制研究的一个新领域。
尽管上述假说在解释药物成瘾行为中都有其合理性,而且这些假说之间并不互相排斥,但是任何一个假说都不能圆满地解释药物成瘾的全部行为特点和整个成瘾病理生理学过程;期望随着研究的深入,能够将这些假说整合形成一个圆满的解释成瘾行为的理论,并能得到行为学和神经生物学研究的有力支持。

第三节 耐受与躯体依赖的神经生物学基础

尽管药物成瘾主要是指以强迫性用药和觅药为特征的精神依赖,但是长期使用精神活性物质也会导致耐受和躯体依赖,且往往出现在药物依赖的早期,与精神依赖形成关系密切。在20世纪90年代,许多药物成瘾领域的著名学者就一致认为,药物成瘾的本质是代偿性适应,而根据代偿性适应出现的快慢和持续时间的长短又可将其分为短时程(脱敏)、长时程(耐受与依赖)和超长时程(成瘾)代偿性适应。虽然到目前为止,这些代偿性适应的神经生物学基础尚未完全搞清楚,彼此是否有因果关系也未完全阐明;但一般认为,药物依赖是一个连续过程,上述不同时程的代偿性适应是相互联系的。因此,在讨论药物成瘾相关内容之前,本文先对药物耐受和躯体依赖进行论述。
一、耐受、躯体依赖的定义
耐受性(tolerance)是在反复使用精神活性物质过程中发生的,某一剂量或浓度下的精神活性物质的某一或某些药理作用与相同剂量下的初始作用相比出现减弱,或必须增加剂量方能获得初始效果的现象。根据与药物处理时程关系的不同,可将药物耐受分为急性耐受和慢性耐受;根据产生耐受的原因不同,又把耐受分为代谢耐受(药动学耐受)和细胞耐受(也称功能性耐受、药效学耐受)。代谢耐受是由于精神活性物质导致肝脏代谢酶表达和(或)活性增加,使药物代谢加快,血浆药物浓度下降而引起的一种耐受。细胞耐受主要通过药物所作用的系统(如受体、效应酶等)发生了适应性改变,使其对相应药物反应下降。细胞耐受是最常见的一类耐受,本节所讨论的耐受即指此类耐受。机体不但对不同精神活性物质的耐受程度不同,而且对同一精神活性物质不同药理作用的耐受程度也不一样。交叉耐受(cross tolerance)是指机体对某种药物产生了耐受性后,往往也对具有同类药理作用的药物敏感性降低,如阿片类药物之间、巴比妥类药物之间、苯二氮 类药物之间,以及苯二氮 类药物与酒精之间均存在交叉耐受现象。
精神活性物质所致的依赖包括躯体依赖(physical dependence)和精神依赖(psychological dependence)两类。躯体依赖也称为生理依赖,指反复使用精神活性物质之后机体调整内稳态而出现一种新的平衡状态(病理性适应态),处于适应态的机体需要持续用药以维持这种平衡;一旦这种新的平衡状态被打破(突然撤药或使用受体阻断剂),将出现戒断综合征(withdrawal syndrome)。戒断综合征是指在机体长期大剂量接触某种精神活性药物之后,突然停药或减少用量,或应用受体阻断剂所引起的一系列症状和体征。戒断症状常常与所用药物的急性药理作用相反。阿片类药物所引起的戒断综合征主要表现包括精神症状、躯体症状和自主神经系统症状三方面;可卡因和苯丙胺类兴奋剂的戒断综合征主要表现为断药后的全身疲乏无力、精神萎靡、抑郁、睡眠延长、过量饮食等。在停止使用精神活性物质一段时间后,主要戒断症状即可消除。但此后较长一段时间内患者仍不能达到身心健康的良好状态,遗留有若干种难以处理的症状,如失眠、焦虑、体力不支和心境恶劣等,这些症状称为稽延症状。戒断综合征也能通过与药物使用相关的线索诱发(条件性戒断)。戒断是引起强迫性用药行为和短期复吸的重要原因之一。
不同的精神活性物质所致的耐受性、躯体依赖性和精神依赖性的程度有很大差别,阿片类物质的耐受性、躯体依赖性和精神依赖性均很强;酒、巴比妥和苯二氮 类药物的躯体依赖性强,精神依赖性和耐受性次之;可卡因和苯丙胺类物质的精神依赖性强,躯体依赖性和耐受性较弱;而致幻剂可能仅有精神依赖,躯体依赖轻微,几乎可以忽略。
目前认为精神活性物质耐受和躯体依赖的分子基础主要是药物作用的受体和受体后信号转导发生的代偿性适应性改变,由于阿片类物质的耐受性和躯体依赖性最强,研究最为充分,因此本部分将以阿片耐受和躯体依赖为重点,介绍其形成的神经生物学机制。
二、耐受的神经生物学基础
阿片类药物的作用靶点是阿片受体。阿片受体属G蛋白偶联受体超家族成员之一。根据分子克隆的实验结果,可将其分为μ、δ和κ三种亚型。阿片受体与G i/o蛋白偶联。当阿片受体被激活后,进一步激活G i/o,抑制AC活性,抑制N型电压门控钙通道、激活G蛋白调节的内向整流钾通道,使细胞膜处于超极化状态。这是阿片类激动剂急性处理产生药理作用的分子基础。但当阿片受体长期暴露于激动剂作用下时,阿片受体本身及其偶联的信号转导过程都发生代偿性适应改变,引起耐受和躯体依赖。
就阿片受体自身而言,像许多G蛋白偶联受体一样,阿片受体在激动剂的作用下除了通过如上所述的分子机制调节细胞的生理功能和生化过程外,还产生快速脱敏和内吞,这是阿片类激动剂急性耐受的主要原因。脱敏(desensitization)是指激动剂所致受体功能性反应的减弱或丧失,受体脱敏是对来自细胞外刺激长时间作用的一种保护性机制,具有适应性反应的意义,同时也是导致药物耐受的主要原因之一。内吞(internalization)是指由于胞吞作用,使细胞膜表面受体进入细胞内。阿片受体产生快速脱敏和内吞的分子机制是被激活的阿片受体在G蛋白偶联受体激酶(G protein-coupled receptor kinases,GRKs)的作用下发生磷酸化,磷酸化的受体与β-arrestin结合,与β-arrestin结合的受体在质膜上处于脱敏状态,与下游信号分子G蛋白脱偶联。结合β-arrestin的受体随后通过clathrin依赖的途径被内吞入细胞内,被内吞的受体通过特定的分选机制被溶酶体降解或再循环至细胞膜完成受体的复敏(resensitization)。阿片受体上述脱敏、内吞、再循环、降解的过程被称为受体的转运(receptor trafficking)。除了GRKs外,在异源表达的细胞中,阿片受体的脱敏和内吞也受到与第二信使相关的蛋白激酶A(protein kinase A,PKA)、蛋白激酶C(protein kinase C,PKC)、钙调蛋白激酶Ⅱ(calmodulin kinaseⅡ,CaMKⅡ)的调节。虽然在神经元上不同蛋白激酶调节阿片受体活性的相对重要性尚未完全阐明,且第二信使相关的蛋白激酶与GRKs和β-arrestin在阿片受体脱敏、内吞和再循环方面的相互作用亦未得到详细阐述,但是激酶介导的脱敏可能是阿片耐受形成的必需事件。激动剂诱导的阿片受体的转运是其维持正常功能的重要方式,如果μ阿片受体内吞和再循环/复敏能力较低,不仅导致耐受和躯体依赖,而且增强奖赏效应,但降低强迫性觅药和复吸倾向性。另外,最近研究发现,阿片受体同型之间或与其他受体之间能够形成同源或异源寡聚体,这些寡聚体表现出新的信号转导和调节特性,对阿片耐受和依赖可能有重要影响。
此外,阿片耐受除与上述阿片受体自身代偿性适应相关外,还与阿片受体信号转导通路中的某些分子(如AC)发生代偿性过表达相关。
三、躯体依赖的神经生物学基础
研究发现,蓝斑及周围灰质与阿片躯体依赖密切相关。蓝斑是脑内最大的去甲肾上腺素能神经核团,其纤维形成上行和下行两个投射通路。向上投射至全部端脑,向下投射至脊髓,行使交感神经及对感觉传入的调控功能。在生理情况下,内源性阿片肽通过激活位于蓝斑及周围灰质内去甲肾上腺素能神经元上的阿片受体,抑制AC活性,使神经元内cAMP浓度降低,引起靶蛋白磷酸化水平下降,最终导致其功能的下调。阿片类药物对蓝斑及周围灰质去甲肾上腺素能神经元的急性作用和内源性阿片肽作用类似。当长期使用阿片类药物时,阿片受体及其偶联的信号转导通路被长时间过度激活,引起一系列与阿片急性作用相反的代偿性适应改变(阿片受体的代偿性适应改变已如前述)。Sharma等于1975年首先在NG108-15杂交瘤细胞中观察到吗啡慢性处理能引起AC表达和AC-cAMP通路功能上调;其后在整体动物的特定脑区如蓝斑、VTA、NAc、杏仁核和导水管周围灰质也证明阿片慢性处理产生AC-cAMP通路的功能上调。该过程主要表现为选择性地上调Ⅰ型和Ⅷ型AC的表达以及PKA的活性和含量(分子调控机制如前所述),使cAMP通路功能上调,其直接结果就是使阿片抑制蓝斑及周围灰质内的去甲肾上腺素能神经元功能下降,引起耐受;此时必须加大阿片类药物的用量以抑制cAMP通路的功能上调,达到新的平衡状态(高AC活性下的平衡)。在这种代偿性适应的情况下,相同剂量下的阿片类药物所产生的药理作用减弱或消失,要获得初始阿片药理作用强度,就必须加大剂量,提示机体发生了耐受;在此平衡点上,如果突然撤药或使用阿片受体阻断剂就会打破这个平衡,cAMP通路功能骤然异常增强,出现神经元内cAMP浓度迅速升高,称此为cAMP超射(cAMP overshooting)。cAMP超射引起蓝斑及周围灰质内的去甲肾上腺素能神经元放电增强,去甲肾上腺素释放增加,影响中枢及自主神经系统功能,引起典型的戒断症状。阿片类物质引起蓝斑去甲肾上腺素能神经元AC-cAMP通路超敏(AC-cAMP pathway hypersensitization)如彩图3-2所示。蓝斑神经元的过度反应与阿片戒断的躯体表现直接相关,因此蓝斑AC-cAMP通路功能的代偿性上调被认为是阿片躯体依赖的重要神经生物学基础。另外,长期使用阿片、可卡因等精神活性物质后,伏隔核内也会形成包括CREB激活在内的cAMP通路功能上调,CREB可使强腓肽的合成增加,这与戒断早期的负性情绪(如焦虑、欣快感缺失等)有关。
使用阿片类物质较短时间即可产生躯体依赖,躯体依赖及戒断症状在成瘾中的作用随药物使用目的不同而有所区别。例如,癌症患者使用阿片类药物治疗疼痛,患者会产生躯体依赖,但一般不会出现强迫性用药,较少形成成瘾。而对于药物成瘾者而言,撤药后的戒断症状(包括躯体戒断症状和抑郁、焦虑等负性情绪)是导致复吸的重要诱因之一。
图3-2 阿片类药物激活μ阿片受体产生的急性效应及慢性处理后AC-cAMP通路超敏
ACⅠ,腺苷酸环化酶Ⅰ;ACⅧ,腺苷酸环化酶Ⅷ;PKA,蛋白激酶A;GIRK,G蛋白调节的内向整流钾通道;N-VDCC,N型电压门控钙通道

第四节 精神依赖的神经生物学基础

一、精神依赖的相关定义
精神依赖(psychological dependence)也称为心理依赖,是精神活性物质长期作用于中枢神经系统产生的一种特殊的精神效应。在奖赏效应(欣快感)和习惯驱动下,使用者反复使用药物,出现对用药失控、强迫性用药及强烈渴求感。药物成瘾主要强调的是处于严重阶段的精神依赖。精神活性物质有奖赏效应和强化效应,奖赏(rewarding)是一种被大脑翻译为内在的正性刺激或要获取的刺激,通常表现为欣快感(pleasure),是多种动机行为的驱动力。强化(reinforcement)是指有助于行为重复出现而进行的奖惩过程,可促使行为重复发生的刺激则称为强化物(reinforcer)。
强化效应依其性质不同,可分为正性强化(positive reinforcement)和负性强化(negative reinforcement)。正性强化效应指精神活性物质改善人体情绪、产生欣快感的作用,使用这些物质后往往会使使用者产生一种无法用语言表述的欣快感,这种感觉驱动使用者不间断地去追求使用药物,形成规律性用药。此作用被称之为精神活性物质的正性强化效应,即奖赏效应。精神活性物质具有正性强化效应,是造成精神依赖启动和早期维持的主要原因。负性强化效应指的是在生理状态下正常机体的各种功能处在一种平衡状态,长期使用某种精神活性物质后,在中枢神经系统的协调下机体会发生代偿性适应并建立病理状态新的平衡,此时如果一旦停止用药,就会打破这种病理状态下的平衡并诱发某些系统的病理性反应,即戒断综合征或某些精神情绪上的负性反应。由于用药者害怕戒断综合征和负性情绪反应的发生而被迫不间断地使用该类精神活性物质以维持这种病理平衡。从临床角度讲,在成瘾后期,患者往往对毒品相关的快感已经耐受,驱动持续用药的主要原因之一是缓解戒断症状相关的渴求以及日常生活相关的不良情绪。
渴求(craving):是一种再次体验精神活性物质效应的强烈欲望。渴求是形成规律性用药的神经生物学基础,与持续用药关系密切,是停药后复吸的重要因素之一。
复吸(relapse):也称为复发,是指经过一段时间撤药后,觅药或用药行为的恢复。小剂量药物、与用药相关的环境和线索(人员、地点、与过去用药相关的物品等)以及应激都能触发强烈的渴求并引起复吸。
点燃(priming):也称为引燃,指对曾经滥用过的物质再次接触,可以激发滥用快速恢复到以前水平或更高水平。
敏化(sensitization):是指反复用药后药物预期效应的增加。例如反复使用精神兴奋剂后运动活性的增加,也可指在有用药史的个体对药物效应的高敏感性(激励性动机增强)。敏化是复吸的神经生物学基础之一,二者可能涉及共同的神经环路。NAc被公认为是与敏化表达关系最为密切的脑区,VTA是敏化形成的主要脑区,但不是介导敏化形成的唯一脑区。多巴胺系统与敏化的关系密切而复杂。不同的成瘾性物质可以直接或间接地上调NAc细胞外多巴胺含量,在敏化的初始阶段发挥着重要的作用。研究显示,多巴胺D 3受体参与敏化的初始阶段。多巴胺D 3受体是G i/o偶联的受体,其激活抑制AC活性,使神经元内cAMP浓度降低,引起靶蛋白磷酸化水平下降,最终导致功能的下调。由于多巴胺对多巴胺D 3受体相对于多巴胺D 1、D 2受体的高亲和力,药物引起的多巴胺过度增加导致脑内D 3受体耐受。而多巴胺D 3受体的耐受使得D 1/D 2受体的作用取得优势,AC-cAMP通路上调,激活PKA和升高下游分子的磷酸化水平,导致药物效应的增强,表现为相同剂量引起的活动性递增。除了多巴胺系统,谷氨酸、GABA等神经递质系统也参与敏化。另外,脑源性神经营养因子(brain-derived neurotrophic factor,BDNF)、转录因子ΔFosB和CREB等参与神经可塑性的重要分子被认为是介导成瘾性物质敏化作用的分子基础。CREB可能在敏化中起到负性调节的作用,而ΔFosB对敏化起正性调节的作用(具体机制见“与药物成瘾相关的转录因子”)。
二、精神依赖的行为学特点
药物精神依赖,是从偶然用药(也称为社会性用药或娱乐性用药),经规律性用药,最终发展为强迫性用药的连续过程。偶然用药指的是由于伙伴效应,社交活动或好奇而偶然使用药物,此时机体的用药行为不具备精神依赖特征;规律性用药指的是机体对药物已产生了精神依赖,形成了时间上相对固定的规律用药行为,但尚不具备明显的强迫性用药特征;药物成瘾是精神依赖的严重阶段,是一种特定的精神依赖状态,强迫性用药和觅药是药物成瘾的终极表现。强迫性用药具体表现为机体不能控制药物使用剂量和频度,即使明知用药后会面临严重后果,仍然坚持用药;强迫性觅药是描述在强烈用药动机(渴求)和药物相关线索驱使下,寻找药物的行为。必须指出的是,由于毒品的种类和生物学特点的不同,上述转换的时程和表现也各不相同。例如可卡因、大麻和苯丙胺类兴奋剂等偶然用药、规律性用药和强迫性用药彼此界限清楚,行为特点明显,各期持续时间相对较长;阿片类毒品则不然,偶然用药和规律性用药持续时间较短,短期内就进入强迫性用药阶段。当然,阿片类药物成瘾者的此行为特征,除与阿片类毒品致成瘾潜能相关外,更与其强大的致躯体依赖作用相关。患者为了避免经历强烈的戒断综合征而表现出强迫用药特征。
强迫性用药和觅药是药物成瘾最显著、最核心的行为特征,是药物成瘾难以治愈、造成成瘾者严重自身危害和引起巨大社会危害的根本原因。近年来研究发现,规律性用药向强迫性用药转化的行为学基础是由目的性行为过渡到习惯性行为的过程。目的性行为是由行为-结果关联介导的,其行为的维持依赖于该行为所产生的结果,如果不能获得预期结果,目的性行为很快消退。在药物精神依赖过程中出现的规律性用药与上述目的性行为非常相似,规律性用药行为的目的是获得药物产生的奖赏,当不能获得药物后(如动物实验中的行为消退训练)觅药行为迅速消退。而习惯性行为则不然,它是由刺激-反应关联介导的,其行为维持不依赖于行为所产生的结果,而是在条件性刺激下(如用药环境、用药线索)产生的自发的持久行为,具有行为不可控和消退抵抗性等行为特征;习惯性行为发展到最后就形成强迫性用药和强迫性觅药行为。这些行为特征不仅在动物自身给药模型中被观察到,而且在临床研究中也确实发现药物成瘾者最初的用药行为是药物奖赏效应以及动机驱动的(目标导向性行为),而且行为可塑性较强;而随着用药时间延长和用药剂量不断增加,成瘾者对药物的奖赏效应出现耐受,但其用药行为却有增无减,同时其用药行为的性质发生了关键性转变,主要表现为药物相关环境和线索下难以转移的、自动化的觅药用药行为(习惯性行为),具有明显的“强迫性”特征。因此,药物成瘾的发展过程是成瘾机体的用药行为从目标导向性向习惯化发展的过程。但是,习惯性用药觅药行为与一般的习惯行为又存在本质的区别。正常情况下,一般的习惯性行为具有高度的适应性,个体依然具有完善的调整行为策略的能力;而习惯性用药觅药行为是病理性的,成瘾者对内部和外部的药物相关刺激保持着持久的高敏感性,并且难以控制其觅药和用药行为,因此成瘾行为可被视为一种适应不良的习惯(maladaptive habit)。
三、精神依赖的神经生物学基础
经过几十年的努力,在精神活性物质的奖赏效应及规律性用药的神经生物学机制方面已经取得了一系列重要进展,近年来也开始了强迫性用药机制的研究。药物成瘾的核心特征是强迫性用药觅药,了解强迫性用药觅药的机制将能够更准确地认识药物成瘾的神经生物学基础。
(一)精神依赖相关的神经核团及神经环路
精神活性物质所致的精神依赖涉及众多核团和脑区,共同组成了皮质-纹状体-丘脑环路(彩图3-3),其中奖赏环路、学习记忆相关环路等发挥了重要作用。
图3-3 药物成瘾相关的皮质-纹状体-丘脑环路
红色箭头:多巴胺能投射;蓝色箭头:GABA能投射;黑色箭头:谷氨酸能投射
1.中脑边缘奖赏环路(reward circuit)
精神活性物质之所以能够引起精神依赖,与它们具有的特殊精神活性作用密切相关,包括愉悦、兴奋、增加觉醒程度、提升情绪和运动性、增加探索行为,甚至致幻等,其中最重要的是奖赏。奖赏有两个主要功能,一个是激活行为,立即改变行为的方向和活跃程度;另一个功能是强化作用,通过学习和记忆过程,改变未来的行为。脑内奖赏系统主要由中脑边缘多巴胺系统构成。多巴胺能神经元胞体位于VTA,神经纤维投射至NAc、PFC、海马、终纹床核、隔核、嗅结节和杏仁核。其中VTA-NAc环路被认为是编码成瘾性药物急性奖赏效应的主要神经环路,与药物引起的奖赏效应密切相关。此外,该环路中的VTA还受到PFC、杏仁核、海马的谷氨酸能投射和NAc的GABA能投射的调节;NAc除接受来自VTA的多巴胺能神经投射外,还受到来自PFC、杏仁核、海马的谷氨酸能投射的调节。NAc是腹侧纹状体的主要组分,也是信息汇聚和整合的关键核团;NAc又分为壳区(shell)和核区(core)。壳区主要介导药物的奖赏效应,而核区主要介导条件性强化。几乎所有的成瘾性物质都能直接或间接地提高NAc细胞外的多巴胺浓度,NAc编码个体获得欣快感(奖赏),并产生再次体验这种欣快感的愿望(动机)。因此,VTA-NAc的多巴胺能奖赏环路是成瘾启动的共同通路。用药初期,精神活性物质激活了中脑边缘多巴胺系统的功能,使NAc区多巴胺水平明显增高,从而产生欣快感;长期用药后,导致中脑边缘多巴胺系统内相关核团或神经元突触发生持续的适应性改变。虽然药物奖赏效应会随着用药时间的延长而逐渐减弱(奖赏耐受),但对药物相关线索却会产生敏化,这是产生渴求、导致复吸的主要因素。同时多巴胺的作用变得更为广泛,从单纯的产生欣快感,转为凸显新异信号的意义、预测奖赏因素是否来临、产生驱动力(动机)、促进关联性学习等。
2.学习记忆相关环路
药物成瘾是由异常学习所建立的一种顽固的刺激-反应习惯,学习记忆相关的神经环路已被证明在成瘾行为的形成和保持中发挥重要作用。研究表明,参与正常习惯学习和记忆的背侧纹状体(dorsal striatum,dStr)在强迫性用药觅药行为中可能发挥着特殊的作用。规律性用药向强迫性用药转化的行为学基础是目的性行为向习惯性行为转变,而其神经生物学结构基础则是NAc向dStr功能的迁移。dStr又可分为背外侧纹状体(dorsolateral striatum,dlStr)和背内侧纹状体(dorsomedial striatum,dmStr)两个亚区。dmStr接受PFC投射形成的环路(其功能与NAc核区类似),主要参与行为-结果偶联学习,影响目的性行为,与规律性用药相关;感觉运动皮质与dlStr相联系,主要参与刺激-反应偶联学习,影响习惯性行为,可能与强迫性用药相关。大鼠可卡因自身给药模型建立初期,NAc壳部与核部的多巴胺释放量显著增加,干预NAc功能影响用药及觅药行为;而随着用药时间的延长,dStr替代NAc而主导对成瘾行为的调控。经历45天可卡因自身给药训练的大鼠dlStr(而非NAc)内的DA释放量显著增加;失活dlStr能够恢复目标导向的可卡因觅药行为,但却抑制强迫性觅药行为。另外,利用正电子发射断层扫描技术(positron emission tomography,PET)发现,仅经历5天可卡因自身给药训练的恒河猴脑内葡萄糖利用率改变只局限于NAc,但经过100天的用药之后,这些改变已扩展到尾壳核(相当于啮齿类动物的dStr)的大部分区域;临床研究也发现可卡因成瘾者dStr(而非腹侧纹状体)的多巴胺功能增强与线索诱发的渴求呈正相关。因此,纹状体腹侧、背侧功能之间的转变是强迫性用药觅药行为产生的重要原因之一。这个转换过程受到来自前额叶不同脑区谷氨酸能的调控。在规律性用药向强迫性用药发展的过程中,NAc和dStr的作用不是孤立存在的,而是通过纹状体-黑质-纹状体(striato-nigro-striatal,SNS)螺旋环路形成功能连接,NAc-dStr间的级联式连接可能参与了强迫性用药觅药行为的发展。另外,作为情绪记忆关键核团,杏仁核也在成瘾行为中发挥重要作用,中央杏仁核主要参与强迫性觅药行为,基底外侧杏仁核在药物相关的条件性线索关联性学习记忆及诱发的复吸中起关键作用;而作为记忆中枢的海马在情景线索关联性学习记忆及诱发的复吸中起重要作用。
上述皮质下结构在成瘾和病理性学习记忆的形成过程中是非常重要的,虽然不是全部要素,但却是必不可少的前提条件。对此最有力的生物学证据是线虫也能对精神活性物质成瘾,形成一些相对简单的记忆行为,而线虫是不具备复杂中枢脑区结构的。因此,重视上述研究结果,充分考虑它们在成瘾干预中的价值和意义是十分必要的。
3.前额叶皮质(prefrontal cortex,PFC)对成瘾行为的广泛调控作用
PFC也是药物成瘾的关键脑区,参与药物成瘾的多方面,包括渴求、动机和决策等。目前研究认为与强迫性用药觅药密切相关的主要是PFC的内侧前额叶皮质(media prefrontal cortex,mPFC)、眶额叶皮质(orbitofrontal cortex,OFC)和前扣带皮质(anterior cingulate cortex,ACC)等亚区。药物成瘾者往往表现出对药物和药物相关刺激的注意偏向、决策障碍、冲动抑制功能缺陷等认知功能障碍,从而产生强迫性用药觅药行为。其主要原因是PFC结构功能发生了改变。PFC接受起源于VTA的多巴胺能投射和起源于海马、基底外侧杏仁核等谷氨酸能投射,又发出谷氨酸能纤维支配VTA、NAc、海马、基底外侧杏仁核等核团。mPFC投射至NAc的谷氨酸能环路功能的适应性改变导致控制功能缺陷、对药物相关刺激敏化。mPFC包括背内侧前额叶皮质(prelimbic cortex,PrL)和腹内侧前额叶皮质(infralimbic,IL),其中PrL主要投射至NAc核区,而IL主要投射至NAc壳区;PrL-NAc核区投射主要调控觅药动机,IL-NAc壳区投射主要调控觅药行为的表达。长期、大量使用成瘾药物导致PrL到NAc投射功能的弱化,促使形成强迫性觅药行为。OFC通过与基底外侧杏仁核和NAc之间的神经联系对事件进行预测,并通过对价值和期望的比较来引导决策;OFC受损之后会导致对反应-结果的判断错误,引起强迫反应的出现。长期用药导致的OFC功能下调使得成瘾者决策障碍,引起强迫性用药觅药行为。另外,损毁ACC会破坏注意的选择以及辨别不同的条件信号的能力,这些能力的丧失导致无法提供及时、准确的信息以便启动行为抑制机制。总之,长期用药引起的PFC认知功能障碍是导致强迫性用药觅药的另一个重要原因。另外,PFC也通过增强刺激的价值凸显和动机意义而参与药物成瘾行为。
4.与复吸相关的神经环路
对药物成瘾的机体即使长期戒断后,药物相关线索和环境、小剂量药物引燃以及应激均可诱发复吸,这也是药物成瘾治疗的难点。经过大量研究,Kalivas提出了复吸的神经环路(彩图3-4)。从VTA到基底外侧杏仁核、再到PFC的投射是药物相关线索诱发复吸的通路;从扩展的杏仁核(包括中央杏仁核、终纹床核和NAc壳区)到VTA、再到PFC的投射是应激诱发复吸的通路;而从PFC到NAc核区、再到腹侧苍白球的投射则是应激、药物相关线索或药物本身诱发复吸的共同通路。相对于多巴胺,谷氨酸系统在复吸中占主导地位。
图3-4 复吸的神经环路
红色:药物、线索或应激诱发复吸的共同通路;绿色:线索诱发复吸的通路;蓝色:应激诱发复吸的通路
(二)精神依赖的相关神经递质系统
神经递质是实现神经环路功能的物质基础。根据现有的研究结果,几乎所有已知的中枢神经递质都不同程度地参与药物成瘾,其中研究最多、也是最重要的是多巴胺和谷氨酸神经递质系统。
1.多巴胺系统(dopamine system)
VTA-NAc的多巴胺能神经通路介导的奖赏效应是成瘾启动的第一步,几乎所有的精神活性物质都能直接或间接激活此多巴胺能神经通路,但它们的初始作用机制并不相同。阿片类药物通过激活VTA内的GABA能中间神经元上的μ阿片受体而抑制GABA能神经元的活动,从而解除GABA能神经元对VTA多巴胺能神经元的抑制,使其在投射靶区NAc释放的多巴胺量增加,激活NAc的GABA能投射神经元,而实现奖赏效应的编码;可卡因和苯丙胺类兴奋剂作用于NAc内的多巴胺能神经末梢,可卡因通过抑制质膜多巴胺转运体阻断多巴胺重摄取;苯丙胺类兴奋剂既能抑制质膜多巴胺转运体阻断多巴胺重摄取,也能通过逆转囊泡单胺转运体2和质膜单胺转运体功能、促进多巴胺逆转运增加多巴胺释放而增加细胞外多巴胺含量,从而上调VTA-NAc的多巴胺神能经通路功能;大麻可通过激活GABA能神经元和谷氨酸能神经元上的CB1受体而增加VTA多巴胺能神经元的放电和NAc内的多巴胺浓度;尼古丁可激活位于VTA多巴胺能神经元的α4β2烟碱型乙酰胆碱受体,从而增加VTA多巴胺能神经元末梢在NAc内的多巴胺释放;乙醇可通过作用于GABA A受体和NMDA受体,以某种间接方式增加NAc的多巴胺释放。
早期认为,多巴胺是产生奖赏(欣快感)的物质基础,而近年来研究则发现,多巴胺还介导了奖赏预期误差和与奖赏相关的关联性学习。Schultz等系统研究了VTA的多巴胺能神经元对奖赏刺激的反应。他们在经典条件反射训练的恒河猴实验模型中研究发现,天然奖赏(如果汁、食物)刺激引起VTA脑区的多巴胺能神经元出现相位性(phasic)放电频率增加,而非天然奖赏性刺激不能引起上述多巴胺能神经元出现相位性放电频率增加,提示多巴胺能神经元能够据此区分奖赏刺激和非奖赏刺激;进一步研究观察到,对不同天然奖赏刺激,上述多巴胺能神经元的放电样式没有显著差别,提示多巴胺能神经元不能区分天然奖赏物的性质。此外,多巴胺能神经元还参与对奖赏的学习,表现为对奖赏刺激的反应可建立起巴甫洛夫条件反射。当把声音或灯光信号与原始奖赏物(果汁)反复配对后,单独的条件性刺激(声音或灯光信号)也可引起多巴胺能神经元相位性放电频率增加,表明多巴胺不仅对奖赏本身(果汁)、也对奖赏出现的预期(条件性刺激)产生反应。这种对奖赏和与之配对的条件性刺激的反应,随配对训练次数的增加而逐渐改变。训练初期,只有原始奖赏能够引起多巴胺能神经元放电频率增加;训练中期,奖赏及条件性刺激都能引起多巴胺能神经元放电频率增加;训练完成后(条件性刺激与奖赏的联系已牢固建立),只有条件性刺激能够引起多巴胺能神经元放电频率增加。这表明通过关联性学习,多巴胺能神经元对原始奖赏的反应能够转移到与奖赏有关的条件性刺激上。当不给予条件性刺激,使实验动物不能预计可能会得到奖赏(奖赏未被预测)时,给予奖赏刺激能引起多巴胺能神经元放电频率增加;当给予条件性刺激,使实验动物能预计可能会得到奖赏(奖赏被预测)时,给予奖赏刺激(奖赏与预期一致),条件性刺激能使多巴胺能神经元放电频率增加,而奖赏本身不改变多巴胺能神经元放电频率;当给予条件性刺激、而未出现奖赏时(奖赏预测错误),条件性刺激引起放电频率增加,而未出现的奖赏导致放电频率减少。这些结果说明,多巴胺能神经元并非对所有奖赏都起反应,而只对实际奖赏与预期奖赏之间的差别起反应,即只对奖赏预期误差起反应。当奖赏比预期更好或在期望之外出现时,多巴胺能神经元为正反应,而当奖赏比预期更差或在期望时间不出现时,多巴胺能神经元出现负反应。精神活性物质使突触间隙多巴胺水平过度而持续的升高,使大脑误以为药物奖赏比预期的好,使得药物的价值凸显,诱发觅药用药行为。由于药物诱发的多巴胺释放量比食物等天然奖赏物诱发的多巴胺释放量更高更持久,一方面使药物相关刺激-奖赏之间的关联性学习更强烈,另一方面也使天然奖赏目标贬值。另外,多巴胺也介导了行为-结果关联性学习和习惯学习(刺激-反应关联性学习)。
细胞外增加的多巴胺通过激活多巴胺受体发挥作用。多巴胺受体分D 1~D 5等五种亚型。D 1和D 5亚型与G s蛋白偶联,统称为D 1样多巴胺受体,主要分布在突触后膜;D 2、D 3和D 4亚型与G i/o蛋白偶联,统称为D 2样受体,在突触前膜和后膜都有分布。D 1样受体和D 2样受体介导的功能及其在成瘾不同阶段所起的作用均不同。D 1样受体主要介导成瘾药物的奖赏和动机敏化,在用药初期的中枢神经系统代偿性适应中发挥主导作用;而D 2样受体可能更多地参与条件性强化和强迫性觅药行为,在用药后期的中枢神经系统代偿性适应中发挥主导作用。在药物成瘾患者和动物模型中均发现纹状体D 2/D 3受体密度降低;用光遗传学技术抑制小鼠NAc内D 2受体阳性的GABA能中等棘状神经元,小鼠则表现出强迫性觅药行为;高冲动性大鼠(D 2受体密度低)更易形成强迫性觅药,但也有研究显示高冲动性大鼠在二级强化训练中延缓形成觅药习惯。这些研究说明D 2受体及其神经元所在的通路在成瘾发展阶段的后期较D 1受体发挥更加重要的功能,D 2受体介导的间接通路主导对强迫性觅药行为的调控,但是确切的调节方式尚不清楚。另外,D 2受体密度可能也是成瘾易感性的生物学标志。高冲动性大鼠在可卡因自身给药训练过程中具有更高的用药频率,具有高冲动性人格的人更倾向于滥用成瘾性药物。而高冲动性背后的分子基础可能是D 2受体密度降低:高冲动性大鼠NAc和VTA内的D 2受体mRNA较低冲动性大鼠显著减少,高冲动性大鼠腹侧纹状体内的D 2/D 3受体密度更低。
2.谷氨酸系统(glutamate system)
如上所述,多巴胺系统主要介导了药物的奖赏强化,在奖赏相关的关联性学习中发挥重要作用,而对长时程关联性记忆影响较小。谷氨酸系统则不然,虽然谷氨酸也参与奖赏相关的关联性学习,但它与长时程关联性记忆关系最为密切,起关键作用。因此,在成瘾启动和形成过程中,多巴胺系统的参与是必需的;而在成瘾维持和复吸中,谷氨酸系统的参与是不可或缺的。大量证据表明,药物引起的欣快感及成瘾的启动需要NAc内多巴胺的释放,而随着反复用药则引起PFC及其投射到NAc等核团的谷氨酸能神经元参与,因此有学者提出从偶然性用药发展为规律性用药,从规律性用药模式下的复吸发展到强迫性用药模式下的复吸经历了从中脑边缘皮质多巴胺系统到前额叶皮质谷氨酸系统、再到皮质纹状体谷氨酸系统占主导地位的过渡。
在药物成瘾过程中,谷氨酸直接或间接调节多巴胺系统功能;同样,多巴胺也能通过中脑边缘皮质投射而影响谷氨酸功能。VTA的多巴胺能神经元活性受来自PFC、杏仁核、海马等谷氨酸能神经投射的支配。一方面,传入VTA的谷氨酸能神经纤维支配多巴胺能神经元胞体,提高了多巴胺能神经元胞体的兴奋性,促进了NAc内多巴胺的释放;另一方面,传入NAc的谷氨酸能神经纤维支配多巴胺能神经元的末梢,通过突触前机制也促进了NAc内多巴胺的释放。NAc内的GABA能中等棘状神经元的树突棘同时与多巴胺能末梢和谷氨酸能末梢形成突触连接,其活动受到这两类神经递质的共同调节。因此,谷氨酸也能调节依赖于中脑边缘多巴胺系统的行为敏化。行为敏化的形成需要VTA谷氨酸释放的短暂增加,从而激活VTA的多巴胺能神经元,使其放电增强,进而引起该环路多巴胺释放的增加;VTA内微注射谷氨酸受体阻断剂能阻断精神活性物质引起的敏化。与NAc类似,背侧纹状体也同时接受多巴胺能投射和谷氨酸能投射而控制其功能,因此,谷氨酸系统也参与强迫性用药觅药行为的调控。总体来说,药物使用初期谷氨酸系统尚未发生适应性改变,随着用药时间延长和剂量增大,PFC对NAc的谷氨酸能支配减弱,使得皮质纹状体功能增强,产生强迫性用药和强迫性觅药。在觅药-用药范式训练中,大鼠NAc核区微注射AMPA受体/KA受体阻断剂后其觅药行为显著降低,提示NAc的谷氨酸系统参与调控用药初期的觅药行为。而经历45天可卡因自身给药训练的大鼠,dlStr(而非NAc)内微注射AMPA受体/KA受体阻断剂显著减少大鼠的觅药行为,提示背侧纹状体的谷氨酸系统可能通过更为稳定的神经适应性改变而参与强迫性觅药行为。
由于长期戒断后复吸的根本原因是异常顽固的成瘾记忆,而谷氨酸及其受体是介导长时程记忆的关键,因此对复吸具有决定性作用的是谷氨酸而非多巴胺。可卡因自身给药大鼠NAc内微注射AMPA可重建觅药行为(即复吸);有学者认为AMPA诱导的觅药行为重建可能与增加局部多巴胺释放有关,但是使用多巴胺受体阻断剂并不能阻断AMPA的重建效应,表明导致复吸的原因是NAc谷氨酸系统的激活。另外,电刺激可卡因自身给药大鼠谷氨酸能纤维丰富的海马腹侧下脚,通过图3-4所述的“复吸回路”重建觅药行为,而刺激多巴胺能纤维丰富的中间前脑束则无效。PFC至NAc的谷氨酸能投射被认为是药物相关线索、小剂量药物和应激诱发的复吸的公共环路,其谷氨酸系统稳态的削弱通过影响神经可塑性而产生持久的行为改变,导致复吸。长期用药使负责维持谷氨酸基础水平的谷氨酸-半胱氨酸交换体密度减少,NAc核区谷氨酸基础水平降低;降低的基础谷氨酸水平使得代谢型谷氨酸受体mGluR2/3介导的突触前负反馈调节能力减弱。在消退训练期连续给予N-乙酰半胱氨酸,通过促进谷氨酸-半胱氨酸交换而升高了细胞外基础谷氨酸水平,从而恢复了突触前mGluR2/3调节能力,防止了线索或药物点燃时诱发的谷氨酸水平的急剧升高,从而抑制了觅药行为的重建。更为重要的是,消退期连续给予N-乙酰半胱氨酸能够逆转长期用药诱导的NAc核区突触可塑性改变,所以即使在停药20多天后仍能抑制线索或药物诱发的复吸。其他能够恢复谷氨酸稳态的手段,如阻断突触后NMDA受体和mGluR5、提高谷氨酸转运体1表达也都能够防止复吸。谷氨酸及其受体是突触传递可塑性的基础,在成瘾的长时程记忆中发挥重要作用,将在下一部分详细叙述。
3.其他神经递质系统
除了多巴胺和谷氨酸外,内源性阿片肽、GABA、5-羟色胺等神经递质通过与多巴胺、谷氨酸系统相互作用,参与了药物成瘾过程。例如,内源性阿片肽和5-羟色胺调节多巴胺系统功能,GABA不仅调节多巴胺系统,还调节谷氨酸系统功能。
GABA是脑内最主要的抑制性神经递质,与兴奋性的神经递质共同协调大脑的正常功能。GABA受体分为GABA A、GABA B及GABA C三种亚型,其中GABA A和GABA C属于递质门控离子通道,GABA B受体为G蛋白偶联受体。VTA的多巴胺能神经元的活动受到GABA能神经元的紧张性抑制,GABA能神经元上存在μ阿片受体,阿片类物质激动μ阿片受体后可抑制GABA能神经元的功能,减少GABA的释放,从而解除对多巴胺能神经元的紧张性抑制,使释放到NAc区的多巴胺含量增加;酒精可作用于GABA A受体和NMDA受体,从而以某种间接的方式增加多巴胺能神经元活性。GABA能神经元对VTA多巴胺能神经元的调节由GABA A受体和GABA B受体介导,激活GABA受体能够抑制精神活性物质的奖赏和强化效应。海马、杏仁核和PFC的GABA神经递质系统也通过影响谷氨酸能锥体神经元的功能而参与精神活性物质相关的情景和线索关联记忆及其所致的认知功能障碍。另外,作为奖赏与动机核心的NAc以及强迫性用药行为关键核团的dStr,它们本身的输出神经元就是GABA能神经元。因此,GABA系统通过调节中脑边缘皮质通路和皮质纹状体通路功能而参与药物成瘾。
内源性阿片肽包括脑啡肽家族、内啡肽家族、强啡肽家族和后来又分离出的许多新的阿片肽,其中最重要的成员包括β-内啡肽、脑啡肽及强啡肽,其作用的受体分别是μ、δ和κ阿片受体。内源性阿片肽及其受体在中枢神经系统尤其是奖赏、动机环路如VTANAc广泛分布。如前所述,外源性阿片类物质能够激活分布于VTA的GABA能中间神经元上的μ阿片受体,解除GABA能神经元对多巴胺能神经元的抑制,增加NAc内多巴胺的释放;而NAc内多巴胺能神经元轴突末梢也存在κ阿片受体,激活κ阿片受体则抑制多巴胺的释放。因此,μ阿片受体和κ阿片受体共同调节NAc内多巴胺的释放。同时,外源性阿片类物质还能通过作用于NAc的中等棘状神经元上的μ阿片受体和δ阿片受体,而调节受多巴胺能神经元支配的棘状神经元的功能。许多非阿片类精神活性物质也能够作用于内源性阿片肽系统。临床前研究显示酒精、可卡因、苯丙胺类兴奋剂能够增加大鼠NAc的内啡肽水平,参与调节NAc细胞外多巴胺水平。另外,苯丙胺急性处理能够调节纹状体内阿片受体mRNA表达;长期饮酒会增加μ阿片受体和δ阿片受体的密度。因此,内源性阿片肽系统通过影响NAc内多巴胺的释放,参与调节多种成瘾性物质的奖赏效应。内源性阿片肽系统除了介导奖赏效应外,还介导了停药后出现的戒断综合征,维持内源性阿片肽系统功能稳定是药物成瘾的治疗策略之一。
(三)精神依赖的神经可塑性机制
中枢神经系统可塑性是长时程行为改变的基础,精神活性物质引发的信号(如多巴胺释放)通过细胞内信号转导和基因表达可以引起神经可塑性的变化,导致神经元编码信息的长时程改变,从而产生持久的成瘾行为。神经可塑性是神经元突触对所接受的刺激作出的功能和结构的适应性应答反应,可分为结构可塑性和功能可塑性。结构可塑性主要指神经元结构重塑,包括神经元胞体大小的改变、树突分支和树突棘形态、数量的改变等;功能可塑性主要体现在突触传递功能的改变,表现形式主要有突触传递的长时程增强(long-term potentiation,LTP)和长时程抑制(long-term depression,LTD),谷氨酸及其受体是介导突触功能可塑性最重要的神经递质系统。精神活性物质诱导的突触可塑性根据不同药物、不同给药方式、不同脑区、同一脑区不同神经元类型、甚至同一细胞不同的树突部位而异,在特定的神经回路有相应的突触重组模式。另外,精神活性物质诱导的神经可塑性在停药后还能维持数个月乃至更久,从而导致异常的成瘾行为和长期戒断后的复吸。
1.神经元结构可塑性
自1997年最早报道了成瘾药物诱导的树突结构可塑性之后,许多研究证实几乎所有的精神活性物质都能诱导脑内奖赏环路的结构可塑性,但是不同类别的精神活性物质对神经元形态的影响不同。总体来说,阿片类物质与精神兴奋剂对结构可塑性的影响是相反的。阿片类物质降低NAc中等棘状神经元、mPFC和海马锥体神经元的树突棘密度和复杂程度,使VTA多巴胺能神经元胞体变小,但是增加OFC锥体神经元的树突棘密度;精神兴奋剂则增加上述核团神经元的树突棘密度和复杂程度。阿片类和精神兴奋剂对神经元形态的影响见表3-1和表3-2。另外,可卡因诱导的结构可塑性还具有细胞类型特异性。NAc的中等棘状神经元分为多巴胺D 1受体阳性和D 2受体阳性两大类,虽然慢性可卡因处理能诱导D 1受体阳性神经元和D 2受体阳性神经元的树突棘密度都增加,但是D 1受体阳性的神经元中长期稳定存在的新生树突棘更多,这可能与D 1受体阳性的神经元中ΔFosB的长期高表达有关。然而,为何阿片类与精神兴奋剂引起的成瘾行为类似,但是对突触可塑性的表型却相反,目前尚不清楚。精神活性物质诱导的突触可塑性与其产生的成瘾行为表型之间的因果关系,目前的研究也存在相互矛盾之处。另外,最近观察到可卡因自身给药大鼠在药物相关线索诱发复吸时也能诱导NAc短暂的树突棘形态及密度改变,这种改变有何生物学意义尚不清楚。
在分子机制方面,以NAc脑区研究的最多。ΔFosB、NF-κB、CREB、MEF2等转录因子在调节树突棘形态方面发挥重要作用,它们通过介导与actin组装相关的分子的转录而影响细胞骨架重排,从而参与突触结构可塑性。在调节转录因子的上游信号通路中,BDNF及其受体介导的PI3K-Akt-PAK和ERK通路可能发挥关键作用。另外,某些结构重塑可能是由多巴胺D 1受体介导的cAMP水平升高或N-甲基-D-天冬氨酸(N-methyl-D-aspartate,NMDA)受体介导的钙离子内流启动的。
表3-1 阿片类药物诱导的神经元形态变化
表3-2 精神兴奋剂诱导的神经元形态变化
2.突触功能可塑性
突触功能可塑性的表现形式主要有LTP和LTD,这两种形式几乎能在大脑所有兴奋性突触表达,并随着成瘾等行为效应而发生改变。
VTA多巴胺能神经元在成瘾启动和形成中具有重要作用。可卡因、阿片类、苯丙胺类兴奋剂、尼古丁和酒精都能诱导VTA多巴胺能神经元突触传递功能(通常以AMPA受体/NMDA受体兴奋性突触后电流比率来指示)增加;相反,非成瘾性精神药物氟西汀和卡马西平则不能引起这种突触效能改变。然而,VTA脑区的上述突触效能改变比较短暂,即使反复给予可卡因也不会使其持续存在,提示成瘾性物质诱发的VTA脑区DA能神经元LTP效应可能与其介导成瘾性物质的奖赏和成瘾启动有关。VTA兴奋性突触不仅可诱导出NMDA受体依赖的LTP,还可诱导电压门控钙通道依赖的LTD。可卡因能易化诱发VTA脑区LTP,并引起行为敏化和条件性位置偏爱。通过AMPA受体基因敲除小鼠的研究发现,可卡因引起的VTA区多巴胺能神经元的兴奋性突触传递可塑性,虽不是行为敏化本身所必需的,但可能是促成药物相关线索与药物奖赏效应相关联的重要神经生物学基础。成瘾性物质除了影响VTA脑区多巴胺能神经元的兴奋性突触传递之外,也影响抑制性突触传递。VTA的多巴胺能神经元还存在抑制性突触的LTP和LTD(LTP GABA、LTD GABA)。单次吗啡处理使药物处理2小时和24小时后的LTP GABA降低,从而解除多巴胺能神经元的抑制性调节,使其更容易响应兴奋性传入而放电。因此LTP GABA受损可能是阿片类增强VTA多巴胺能神经元活性的另一种机制。最近还发现,单次吗啡处理也能抑制药物处理24小时后多巴胺能神经元的LTD GABA,所以吗啡对GABA能末梢的突触可塑性可能具有双向调节作用。慢性药物处理对LTP GABA和LTD GABA的影响尚不明确。
精神活性物质在不同脑区可以诱导不同的突触功能可塑性,例如单次给药即可诱导VTA的突触功能可塑性变化,而对NAc只在重复给药后才产生此效应。动物经可卡因连续被动给药5天,在戒断10~14天后,NAc脑区中的中等棘状神经元兴奋性突触的AMPA受体/NMDA受体电流比率降低。这种突触效能的降低亦可出现在经可卡因处理的动物的NAc脑区,在电生理学研究中表现为LTD幅度下降并伴有AMPA受体表达下调。长时间的可卡因戒断可引起NAc脑区无GluR2的AMPA受体增加,NAc局部注射无GluR2的AMPA受体阻断剂能阻断自身给药动物线索诱导的复吸行为。另外,药物引起的行为敏化依赖于NAc的LTD,阻断NAc的LTD发生能够预防苯丙胺诱导的行为敏化。这些研究提示,NAc的LTD是行为可塑性的重要适应形式,成瘾性物质使其长时程受损可能是导致成瘾行为的原因。
除了VTA和NAc,精神活性物质也影响海马、PFC、杏仁核等其他脑区的突触可塑性。在海马脑区存在着NMDA受体依赖LTP(主要在海马CA3-CA1区的Schaffer侧支通路)和NMDA受体非依赖性LTP(主要在海马纤维-CA3突触,其产生主要依靠电压门控性通道开放,引起钙离子浓度增加)。总体来讲,吗啡反复给药损害海马LTP,而戒断则能易化LTP;可卡因反复给药易化海马LTP。但海马脑区这种NMDA受体依赖性LTP是否参与成瘾行为的学习记忆过程尚未被完全证实。另外,具有强迫性用药、觅药行为和异常高的用药动机的可卡因成瘾大鼠mPFC内出现依赖于mGluR2/3的LTD受损现象,而非成瘾大鼠则无此现象,提示mGluR2/3介导的LTD受损可能是药物使用转变为药物成瘾的关键。
在突触功能可塑性相关的分子机制方面,成瘾状态下兴奋性突触传递可发生两种适应性改变:一是促进突触前的谷氨酸释放;二是突触后对谷氨酸的反应性发生改变。突触前谷氨酸释放的增加,如前所述主要是由于突触前mGluR2/3的抑制性降低,其机制是由于突触间隙外谷氨酸基础水平降低所致;突触后对谷氨酸反应性的改变,主要与突触后膜NMDA受体、AMPA受体水平有关。AMPA受体与NMDA受体介导的兴奋性突触后电流比率(AMPA/NMDA比率)是反映兴奋性突触传递强度的指标。AMPA受体调节脑内大部分兴奋性突触的传递,其在突触后膜的快速迁入和迁出对LTP、LTD起到很重要的触发作用,AMPA受体的动态调节对正常突触功能和病理生理情况下的突触功能的改变都至关重要。AMPA受体GluR1亚基基因突变小鼠不能表达可卡因或应激诱导的VTA脑区的LTP及条件性位置偏爱效应,而反复暴露于可卡因、吗啡、酒精则可导致GluR1蛋白表达的增加。GluR2缺失的AMPA受体可能介导了可卡因渴求及复吸行为。另外,LTP的诱导还能增加GluR1亚基主要PKA位点的磷酸化。NMDA受体由基本亚基NR1和调节亚基NR2A-2D组成,选择性敲除多巴胺神能经元NR1亚基,可导致NMDA受体调节的兴奋性突触后电流及可卡因诱导的突触可塑性不能形成。还有研究提示,NMDA受体的NR2A亚基可能是建立NMDA受体依赖性LTP所必需的,NR2B则可能主要参与LTD的建立,因此,突触后膜NR2A和NR2B的相对量可能影响可塑性的性质;另外,NR2B亚基还能通过影响AMPA受体亚单位及其相关信号分子CaMKⅡα在突触后膜的表达,从而参与LTP。阻断NMDA受体,可特异性地阻断被测脑区的LTP和LTD,同时抑制吗啡诱导的条件性位置偏爱效应;拮抗NR2A或NR2B亚基的功能,都可抑制可卡因单次注射24小时后诱导的VTA脑区神经元AMPA/NMDA比率的增高。此外,VTA、PFC、海马等脑区中还存在代谢型谷氨酸受体(metabolic glutamate receptors,mGluRs)依赖的LTP、LTD。mGluRs与G蛋白偶联,通过细胞内的多种信使系统介导慢突触传递,在LTP、LTD的诱导和维持中起着重要的调节作用。mGluRs可以降低LTP诱导的阈值,增加其时间和幅度,甚至可以直接诱导出LTP;个别形式的LTD必须依赖于mGluRs的激活。研究发现,可卡因诱导的VTA突触可塑性由mGluR1门控,缺少mGluR1导致VTA区功能持续性增强以致NAc的突触可塑性变化,这可能也是可卡因长期戒断后产生觅药行为的原因。药物成瘾者mGluR1功能受损,为药物成瘾的突触可塑性机制研究作了补充。另外,PSD-95、Homer蛋白等突触相关蛋白能够通过帮助谷氨酸受体及与之关联的信号蛋白在突触处簇集而参与突触可塑性。
总之,突触可塑性是精神活性物质所致的细胞适应的形式,精神活性物质能够引起奖赏环路、记忆环路多个脑区的突触结构和功能改变,这些突触可塑性改变究竟是产生成瘾行为的机制、还是使用药物伴随的变化,是今后研究的重点。
(四)精神依赖的转录因子及表观遗传学调节机制
精神活性物质引起的成瘾行为学改变是由神经核团和神经通路调控的,而神经核团和神经通路的结构和功能又是以神经可塑性为基础的;神经可塑性的改变则是由蛋白表达的时间、空间和量的改变决定的。因此,转录因子和表观遗传学调节机制是药物成瘾神经生物学机制的基础和最重要的组成部分。
1.与药物成瘾相关的转录因子
药物成瘾神经生物学机制研究的重点之一是阐明精神活性物质是如何引起成瘾的。为实现此研究目的,人们常把研究精神活性物质急性作用如何转变为具有成瘾特征的慢性作用作为研究的切入点。大量的研究表明,转录因子(transcription factors)在其中可能起到非常重要的作用。CREB是受cAMP和Ca 2+调节的一种转录因子,也是学习记忆中研究最多的转录因子之一。可卡因、苯丙胺类兴奋剂和阿片类药物反复使用均可使NAc、dStr、PFC、杏仁核等核团CREB表达上调、活性增强,并能持续较长时间。在NAc脑区内,CREB活性升高对精神依赖来说是一种负反馈机制,与奖赏耐受和戒断期的负性情绪状态表达相关。这些因素促进了自身给药行为的形成和维持,与复吸关系密切。多巴胺能提高CREB活性。中枢兴奋剂(可卡因和甲基苯丙胺等)和阿片类药物通过上调细胞外多巴胺浓度而长期激活D 1受体,上调靶神经元内cAMP浓度、激活PKA,使CREB磷酸化而增强其转录活性。但是并非所有的成瘾性物质都能诱导NAc内CREB活化。酒精、尼古丁常降低NAc内CREB的活性。CREB介导的奖赏耐受与其诱导NAc内强腓肽过度表达有关。高表达的强腓肽通过激活VTA多巴胺能神经元细胞膜上的κ阿片受体而抑制VTA至NAc的多巴胺能神经传递,减弱奖赏效应。另外,CREB活性与NAc中等棘状神经元功能活动直接相关,过表达CREB增加中等棘状神经元的兴奋性。因此,CREB可能通过上调中等棘状神经元的兴奋性而对可卡因诱导的行为敏化起“刹车”的作用。CREB的下游靶分子还包括一些离子通道和谷氨酸受体亚基,通过这些靶分子调节NAc神经元兴奋性和突触可塑性。中枢兴奋剂和阿片类也能激活PFC、dStr、杏仁核等脑区的CREB,但是这些脑区CREB的下游靶基因及其产生的行为反应还不十分清楚。
ΔFosB是FosB基因的短截产物。急性给予精神活性物质能快速而短暂地升高NAc和dStr内c-Fos及Fos家族其他成员的表达水平,8~12小时内恢复至正常,推测这些Fos蛋白被短时、迅速的诱导表达,可能与急性药物暴露对突触功能的改变有关。而长期使用成瘾性物质则引起NAc和dStr内ΔFosB表达的持续升高,并且停药数周仍能维持这种高表达。几乎所有的成瘾性物质(如可卡因、苯丙胺类兴奋剂、阿片类物质、酒精和尼古丁)均能引起NAc内ΔFosB的持续高表达,并且选择性表达于D 1受体阳性的中等棘状神经元中;而且在成瘾患者脑内也观察到这种现象。大量证据显示,D 1受体阳性神经元中ΔFosB的诱导表达增加了这些神经元对可卡因和吗啡奖赏效应及运动活动的敏化,也增加了可卡因自身给药行为及用药动机,提示ΔFosB与药物的敏化效应密切相关。由于ΔFosB较为稳定,在停药数周甚至数个月后都可驱动这种行为改变,被认为可能是启动与维持成瘾状态的分子开关。目前,ΔFosB的多种下游靶分子已被鉴定出来,其中强啡肽也是ΔFosB的下游靶分子之一,CREB诱导强啡肽表达升高,而ΔFosB则抑制强啡肽的表达。另外,ΔFosB的靶分子还包括一些与突触可塑性密切相关的分子,如突触结合蛋白、微管相关蛋白、激活调节的细胞骨架相关蛋白、actin相关蛋白、细胞周期素依赖性激酶5、驱动蛋白等,因此,大多数学者认为ΔFosB可能参与调控NAc内的中等棘状神经元的树突棘形态改变。此外,表观遗传学调节机制中的重要分子组蛋白甲基化转移酶G9a等也是ΔFosB的重要下游靶基因。通过此调控机制,ΔFosB能引起更为持久的染色质重塑。
CREB和ΔFosB对药物成瘾的调节作用显示不同的时间特征。以前有研究显示,给予可卡因5天后NAc内差异表达的基因中有19种受CREB的调控、8种受ΔFosB的调控,而给药4周后差异表达的基因中只有5种受CREB的调控、22种受ΔFosB的调控,提示在较短时间的药物处理中CREB扮演重要角色,而较长时间的药物处理后ΔFosB逐渐占主导地位。另外,停药数天后CREB的激活状态消退,而ΔFosB的高表达能持续数周,这可能是戒断不同阶段表现不同行为效应的分子基础,例如戒断早期以负性情感症状和药物敏感性降低为主,而戒断较长时间后以药物奖赏和动机敏化效应为主。
近年来还发现其他转录因子在药物成瘾中可能也发挥着重要作用。NF-κB是一种被多种刺激快速激活的转录因子,以前研究主要集中在免疫应答和炎症方面,近年来发现它也与突触可塑性和学习记忆相关。慢性给予可卡因能诱导NAc内的中等棘状神经元NF-κB表达水平升高,同时伴随该神经元的树突棘密度增加和对可卡因奖赏效应的敏化。可卡因诱导的NF-κB的表达由ΔFosB介导,体现了药物作用导致的复杂的转录因子级联反应。最近在应激和抑郁症的模型上也发现NAc内中等棘状神经元NF-κB表达上调,诱导中等棘状神经元树突棘密度增加。这些发现对于理解抑郁症与药物成瘾共病的神经生物学机制可能有重要的提示。
NAc内的中等棘状神经元也表达多种形式的肌细胞特异性增强子因子2(myocyte-specific enhancer factor 2,MEF2)蛋白,它们形成同源或异源二聚体,通过与其他因子结合而激活或抑制基因转录。MEF2调控基因转录的方式取决于其结合的是共激活因子(如p300蛋白)还是共抑制因子(如Ⅱ型组蛋白去乙酰化酶)。研究发现,慢性可卡因处理通过抑制NAc内MEF2活性而增加了中等棘状神经元的树突棘密度,可卡因抑制MEF2活性是通过D 1受体-cAMP依赖的神经钙蛋白和细胞周期素依赖性激酶5(ΔFosB的下游靶基因)实现的;而MEF2活性降低则抑制了可卡因的行为敏化效应。此研究提示MEF2可能是可卡因诱导的突触结构可塑性和行为可塑性的关键调节分子,MEF2活性的降低及中等棘状神经元树突棘密度的增加可能作为一种代偿性机制抑制可卡因成瘾。但是,前述研究有提示ΔFosB及NF-κB介导的中等棘状神经元树突棘密度增加可能是可卡因诱导敏化的基础。我们认为,NAc中等棘状神经元树突棘密度增加究竟是促进成瘾还是降低成瘾,可能取决于药物处理的时间、观察的是何种行为反应、密度增加的树突棘是何种形态以及形成的是何种类型的突触连接等因素。如何理解这些看似矛盾的现象,仍需要大量的研究。
虽然发现了多种与药物成瘾相关的转录因子,但是没有一种分子的改变能像成瘾行为那样持久,因此脑内一定存在着更为稳定的受转录因子调控的持久性改变。推测一种可能性是转录因子表达的改变虽然持续时间不够长,但由其引起的神经元可塑性改变可能更稳定、更持久;另一种可能是转录因子表达的改变启动了可长期存在的染色质结构重塑,引起基因表达和突触结构发生更持久的改变。
2.表观遗传调节
表观遗传是在不改变DNA序列的前提下,通过其他生化过程使机体内某些基因表达发生可遗传的改变,表观遗传调节机制主要包括组蛋白修饰、DNA甲基化、非编码RNA调控等,导致染色质重塑。表观遗传修饰极其稳定,可能是成瘾行为长期存在的分子基础之一。以DNA甲基化、组蛋白修饰、microRNA调控为代表的表观遗传机制是精神活性物质诱导神经可塑性和成瘾行为的重要调节方式,但是对其调节机制的认识还很少。