成瘾医学:理论与实践
上QQ阅读APP看书,第一时间看更新

第二节 评价药物强化效应以及依赖性潜力的动物模型

一、自身给药
自身给药(drug self-administration,DSA)模拟了人类药物滥用行为,绝大多数人类滥用的药物都能在实验动物上建立自身给药行为。特别是1962年Weeks在Science上发表了第一篇关于大鼠静脉自身给药的实验技术,使得自身给药技术成为研究药物奖赏效应和药物成瘾行为最重要的模型之一。
Box 5-1 成瘾是否为人类所特有?
自身给药动物模型的历史,从某种意义上说也是药物成瘾研究的历史。Spragg的大猩猩吗啡实验回答了一个历来已久的问题:成瘾不是人类特有的现象。
20世纪30年代,发现了吗啡和其他阿片类药物在动物上具有耐受现象,但一直没有令人信服的实验证据表明动物可以通过主动的行为来获取药物。Spragg根据大猩猩实验首次提出药物具有正性强化特性。1935年秋,刚刚获得博士学位的Spragg在耶鲁大学灵长类生物学实验室开始一个研究项目,目的是为了证明动物是否也可以对药物成瘾,结果发现大猩猩的确可以通过做一些行为动作来获取吗啡。
Spragg给成瘾定义为对药物的需要和追求,重复给药可以增强这种“需求”。他给大猩猩每天两次注射吗啡直至达到躯体依赖状态(此时停用吗啡就会产生躯体戒断症状),然后采用不同的方法测量大猩猩对吗啡的“需求”。其中有两个大猩猩实验还拍摄了电影胶片。从这些电影片段里可以看到,停止吗啡注射后一段时间,一个大猩猩硬拉着Spragg往注射吗啡的房间去。更重要的是,“剥夺吗啡”的大猩猩可以通过训练完成一定的任务来得到吗啡注射,这是测试“需求”的最主要手段,而且反映出人类和猩猩成瘾的相似性。Spragg建立了一套偏爱测量方法。给大猩猩两个木棒,一个黑色,一个白色,用来开启两个不同颜色的木箱。长时间禁食时,猩猩选择黑木棒开启装有香蕉的黑木箱;长时间剥夺吗啡时,猩猩会选择白色木棒开启装有吗啡注射器的白箱,有时猩猩会把吗啡注射器交给Spragg让他来注射。
上述实验所能得出的最直接的结论是大猩猩和人一样可以表现出吗啡成瘾行为,可以作为模拟人类吗啡成瘾的动物模型。在当时条件下,大鼠是否可以表现出吗啡成瘾行为,Spragg也持怀疑态度。他写道:“因为吗啡成瘾的关键在于注射吗啡和减轻戒断症状之间需要形成一种关联,而形成关联的过程包含10~15分钟或更长的时间延迟过程,只有在进化程度上较高等的动物才具有建立长时间延迟关联的能力。因为大鼠不具备建立延迟关联的能力,因此也就不可能对吗啡成瘾。”
(一)非操作性自身给药(口服自身给药)
通常意义的自身给药指的是操作性自身给药(operant drug self-administration),而广义的自身给药还包括非操作性自身给药(non-operant drug self-administration),专门指酒精口服自身给药(oral drug self-administration)。当然,操作性的自身给药也可以通过口服来给药。对于啮齿类动物来说,相比于其他给药途径,酒精通过口服最容易建立起自身给药行为,通过其他途径如静脉给药则较难。与酒精相反,其他药物如海洛因、吗啡、尼古丁、可卡因、甲基苯丙胺等通过口服其强化效应大打折扣,静脉给药是最佳选择。
酒精口服自身给药很好地模拟了人类喝酒行为。在实验环境中,通常同时提供两个饮水瓶,一个装普通的饮用水,另外一个装含有酒精的水,动物可以完全自主地选择饮酒或饮水。该方法不需要特殊的实验设备、简单易行,而且结果稳定易重复,成为研究酒精成瘾行为的最佳模型。对于酒精口服自身给药,酒精浓度至关重要,不能太低(如低于4%)或太高(如高于15%),合适的浓度范围大概是8%~12%。因为酒精本身有味觉厌恶效应,为了使自身给药行为更容易建立,可以在开始阶段限制水供应,只提供含酒精的水;也可以从低浓度开始逐渐增加;或者采用蔗糖/酒精梯度,开始时酒精浓度为零,只含蔗糖。随着训练的进行,蔗糖浓度逐渐减少而酒精浓度逐渐增加,直至蔗糖浓度为零。酒精口服自身给药测量的实验指标是酒精饮用量和酒精/水偏好的百分比。
(二)操作性自身给药
操作性自身给药(operant drug self-administration)是在被称为斯金纳箱(Skinner Box)的操作性实验笼内完成,其实验原理完全基于斯金纳(Burrhus Frederic Skinner)创立的“操作条件反射”理论。斯金纳是美国著名行为主义心理学家,新行为主义的代表。他把行为分为两类:一类是应答性行为,即由已知的刺激引起的反应(刺激-反应),其实就是经典(巴甫洛夫)条件反射;另一类是操作性行为,机体发出的主动行为以达到某种目的(行为-结果)。如果行为的结果促进该行为的再次发生,那么这个过程称为强化(reinforcement),相应的结果称为强化剂或强化刺激(reinforcer)。正性强化是指行为可以带来有利的结果,负性强化则是指行为可以避免不利结果的发生。
正性强化剂具有奖赏效应,例如自然奖赏(食物、水、性)和药物奖赏。斯金纳的实验大都是建立在食物或水作为自然奖赏刺激的基础上完成的,主要是以鸽子和大鼠为实验对象,一个典型的操作实验箱通常配备有一个或两个压杆(或红外鼻触)、几个信号灯、一个可以提供食物或水的装置,饥饿或饥渴的动物通过压杆获得食物或水,而自身给药实验则是把药物作为奖赏刺激(彩图5-1)。
图5-1 动物操作条件反射箱
A.实验笼内通常有一个或两个压杆,一些信号灯或声音,一个奖赏装置(颗粒食物泵或液体食物装置);B.静脉自身给药示意图,在传统的操作箱内配备一个输液泵以及输液支架等
早在1955年,Headlee实验室就首次报道了吗啡依赖大鼠成功建立了腹腔注射自身给药行为。1962年,Weeks最先建立了大鼠静脉自身给药技术,从而成为应用最为广泛的自身给药技术。此后相继报道了大鼠口服吗啡自身给药、猕猴静脉自身给药、大鼠侧脑室吗啡自身给药等。其他给药途径和实验动物也都相应建立了自身给药模型。自身给药途径主要有静脉、口服、胃、侧脑室、脑内;实验动物有大鼠、小鼠、猕猴、鸽子、松猴等。
静脉自身给药是最常用的自身给药技术,大鼠是用得最多的实验动物。近年来,转基因和基因敲除小鼠的大量应用使小鼠静脉自身给药行为得到关注,而猕猴静脉自身给药只有为数不多的实验室有条件开展研究。大、小鼠静脉自身给药系统通常是在商业化的操作实验笼内完成,部分有条件的实验室也可以自制。猕猴静脉自身给药没有完整的商业化实验系统。
静脉自身给药实验通常需要以下3个步骤。①手术:埋植静脉插管,大、小鼠一般采用颈静脉插管,插管从背部或头部引出,术后康复通常需要7天。②训练:如果实验笼配置的是压杆,则需要先进行食物或糖水压杆训练,如果配置的是鼻触,可以直接进行药物训练。食物或糖水训练首先需要限食或限水,动物建立了稳定的压杆行为后就可以开始给药训练。给药训练天数根据需要确定,一般训练14天,训练程序通常采用固定比率1(FR1),即在反应期内每次反应(完成正确的压杆或鼻触)都可以得到药物奖赏。③测试:自身给药行为稳定后即可开始测试,测试方法依实验目的而定。例如建立药理学剂量曲线、核团给药、核团损毁、大脑切片免疫组化、建立复发行为测试等。
静脉自身给药在药物开发和药物成瘾研究中应用广泛,如药物依赖性潜力评价、治疗成瘾药物开发、成瘾的中枢机制研究等。还可以评价药物奖赏效应的强度,训练使用的程序是累进比率程序(progressive ratio schedule,PR),通常用PR3-4程序(即第3次奖赏条件是需要4次反应),反应条件采用一个指数公式获得,数据序列是1,2,4,6,9...实验开始,一次反应就可以得到奖赏,随着给药次数的增加,反应条件按指数曲线快速增加,动物为了获得下一次给药需要付出多倍的努力。当在给定的时间内动物无法通过行为完成下一次药物注射时,最后一次给药的反应条件被称为“断停点”(break point,也称为“断点”)。“断停点”反映了动物为了获得药物注射愿意付出的劳动强度的大小,同时也反映了药物奖赏效应的强度。对于奖赏效应强的药物如可卡因、甲基苯丙胺、海洛因,“断停点”就高;而奖赏效应相对弱的药物如吗啡、尼古丁,“断停点”就低。
二、条件性位置偏爱
条件性位置偏爱(conditioned place preference,CPP)是一个普遍现象,存在于高等动物以及低等动物。如果在一个地方得到过奖赏或愉悦的体验,那么生物体就会偏好这个地方,比没有得到过奖赏的地方停留的时间多;如果在一个地方得到过惩罚或不愉悦的体验,那么生物体就会回避这个地方,这就是条件性位置厌恶(conditioned place aversion,CPA)。CPP的基本原理一般认为是奖赏刺激和“位置”信息通过巴甫洛夫条件反射建立了关联,它反映了“位置”信息的条件性奖赏效应,然而也有学者认为CPP也可以被认为是一种操作性条件反射行为。利用CPP现象可以评价自然奖赏以及药物奖赏,在药物成瘾研究领域得到广泛应用。
CPP的历史比自身给药技术早,然而直到20世纪80年代末才得到广泛应用。虽然说Spragg博士的黑猩猩吗啡实验(1940年)是一种简单的CPP设计,但和现在的CPP实验设计最接近的应该是Beach设计的大鼠Y形迷宫吗啡CPP(1957年),这比Weeks的大鼠吗啡静脉自身给药技术还早(1962年),而在此之前Garcia等建立了大鼠对电离辐射的CPA实验(1957年)。目前使用的CPP方法基本是建立在Rossi和Reid发表的大鼠吗啡CPP实验技术(1976年)基础之上,以大鼠在伴吗啡环境和生理盐水环境停留时间之差作为主要实验指标。
大量研究表明,几乎所有能在实验动物上建立自身给药行为的药物都能建立CPP行为。但这两种方法也有不同之处,例如一些能阻断多巴胺受体的抗精神病药物能减弱可卡因的自身给药行为,但不能阻断CPP行为。
(一)实验设计
CPP有商业化的大、小鼠实验装置,因为装置简单,好多实验室也采用自制。最经典的CPP装置由一个黑色和白色的有机玻璃盒子组成,黑盒子底部用有机玻璃,稍微加一点稀释过的醋,白色盒子底部放置一个金属网,下面放些锯末垫料。动物可以在黑、白箱之间自由活动,这样设置的结果是动物对任何一侧都没有自然的偏好,任何一侧都可以作为伴药箱或生理盐水箱,这种实验设计称为平衡(balanced)或非偏(unbiased)设计。另外一种设计是非平衡(unbalanced)或偏好(biased)设计,动物自然地偏好一侧,相对不喜欢的一侧则作为伴药箱。
CPP的命名严格来说是不够严谨的,易引起错误的理解,这里的“位置”一词与八臂迷宫和水迷宫的空间位置信息是不同的。在CPP实验中,与药物建立关联的刺激不是空间“位置”信息,而是视觉、触觉和嗅觉刺激。这三种刺激究竟哪个与药物的强化效应关联最为敏感可能因药物而异,而且专门针对这个问题的研究很少。以吗啡为例,单独的视觉刺激或视觉加触觉就可以建立CPP行为,目前还没有文献报道是否三种刺激比单独的一个刺激更敏感。
在非偏设计中,动物对两侧都没明显的偏好,平衡分组很重要,一组使用一侧为伴药侧,还要增加一组使用相对的一侧作为伴药侧。对于偏好设计,需要前测试验(pre-testing)来探明动物对哪一侧天然的偏好,相对不偏好的一侧通常作为伴药侧,当然无法进行平衡分组。
(二)结果与解释
吗啡是CPP实验研究得最多的药物,大鼠有效的剂量范围很宽(0.08~10mg/kg)而且灵敏,很低的剂量就可以建立CPP行为。虽然通常训练用8天时间(4天药物,4天生理盐水),一次药物和生理盐水训练即可建立吗啡CPP行为。吗啡CPP行为维持的时间也很长,有报道3次训练一个月后仍然可以观察到CPP。
实验结果与非偏和偏好设计有关,例如在非偏设计中,可以观察到吗啡处理的大鼠对纳洛酮厌恶行为(CPA),而用偏好设计就观察不到。实验结果的不同很大程度上是因为基线和天花板效应,在偏好设计中,通常是动物不喜欢的一侧作为伴药侧,纳洛酮的CPA行为要求对这一侧更不喜欢,已经触及了行为基线。
CPP测试是在无药的状态下进行的,可以排除药物的其他作用对行为的干扰,实验结果最直接的解释就是药物的奖赏效应。当然也无法排除另外一种可能:好奇本能(novelty seeking)和状态依赖记忆(state-dependent memory)。可以这样来理解,伴药箱在训练时有药存在,而测试时无药,因为状态依赖记忆,测试时伴药箱相当于一个新环境(状态依赖性记忆的缘故),动物在伴药箱停留增加可以解释为好奇。有文献报道单独的新奇刺激无法建立CPP行为,训练时单独暴露一侧,测试时不会对另外一侧偏好;也有报道可以排除状态依赖的记忆,有吗啡的状态下测试结果和无药是一样的;而且在三箱实验装置里,测试时对于动物来说中间箱是新的区域,一样可以建立对吗啡伴药侧的偏好。
(三)应用
CPP作为评价药物奖赏效应测试模型的最大优点是实验装置和方法简单,结果稳定可靠。与静脉自身给药相比,动物不需要手术,省时、省力、周期短。因此被广泛应用于药物依赖性潜力初筛、药物奖赏效应机制研究。该方法不仅对药物的奖赏效应敏感(CPP),而且对药物的厌恶效应同样敏感(CPA),而自身给药实验对中性与厌恶效应则难以区分。缺点是因为个体差异大,所需动物量就大,假阳性率也高,而且缺乏非人灵长类和人体试验数据,无法有足够的数据进行横向比较,因此在药物滥用潜力评价体系中很少把CPP作为关键技术。
三、药物辨别
药物辨别(drug discrimination,DD)与自身给药一样,属于操作性条件反射行为。它可以判断一种药物在控制行为方面是否具有辨别刺激特性,即能否使动物辨别或区分两种或两种以上的药物情形,继而产生不同的行为反应。
药物辨别在药物滥用潜力评价方面占据非常重要的地位,虽然我国的新药依赖性潜力评价体系中没有把药物辨别作为规定项目,但在国际上,新药临床前药理学、药物滥用潜力评价中,药物辨别得到广泛应用。对于自身给药和条件性位置偏爱行为,学术界很容易接受药物强化和奖赏效应理论,然而至今为止,药物辨别的理论一直不是很清晰。至少一点是肯定的,绝大多数具有中枢活性的药物都可以在实验动物上建立药物辨别行为,动物不仅可以分辨不同种类的药物,甚至还可以辨别出一些在人类很少发现有滥用倾向的中枢活性药物。
(一)历史
药物辨别得从状态依赖性学习或记忆(state-dependent learning,SDL)谈起,这也是解释药物辨别的理论之一。最早描述状态依赖性学习现象出自Combe在1830年出版的《 A system of Phrenology》一书。书中描述了一个爱尔兰搬运工有一次醉酒醒来后想不起钱包放在了哪里,然而在下一次又醉酒的时候居然想起了放钱包的地方。1931年查理·卓别林的第一部无声电影《城市之光》里有一个情节,剧中主角流浪汉无意救了一个醉酒的富翁并得到款待,然而当这个富翁清醒后却翻脸无情,这个剧情就反映了当时对药物影响记忆这一现象的社会认识程度。
1937年,伊利诺伊大学Girden和Culler首次报道了关于状态依赖性学习的实验研究。1951年,Conger首次报道了大鼠的酒精辨别行为,也是首次从辨别控制(stimulus control)的角度来解释实验结果,被认为是药物辨别实验的第一篇正式的文献报道。1964年,Overton专门设计了一个大鼠T形迷宫实验,使用大剂量的戊巴比妥钠(25mg),用电击训练大鼠走迷宫,结果发现有药状态下学习的电击逃避行为在无药条件下会出错,如果在给药状态下重新测试,逃避行为就会正常。反过来训练也得到同样结果,这提供了强有力的证据说明药物可以影响记忆的提取。随后该实验室以及其他实验室发现了药物辨别替代现象。1971年,Devietti和Larson设计了一个与Overton类似的实验,观察不同电击强度对记忆的影响,同样得出结论,认为动物的状态影响一个习得行为记忆的提取。针对这个研究一直持续到现在,2004年,Zarrindast和Rezayof发现吗啡可以影响小鼠状态依赖性的学习记忆。
早期的状态依赖性学习研究大都是利用迷宫行为作为学习模型,例如T形迷宫,发展到后来的斯金纳操作箱成为药物辨别实验的标准设备。T形迷宫下的行为需要大剂量的药物处理,而操作箱下的行为动物对药物训练剂量敏感性和选择性大大提高。现代的药物辨别技术非常成熟,实验动物从大鼠、小鼠、鸽子、豚鼠到松猴、猕猴、狒狒等,临床研究也有很多报道。
(二)实验装置
药物辨别实验需要的设备是操作条件反射箱,一般配备2个压杆或2个鼻触,以及一个食物奖赏(颗粒食物或糖水)装置或惩罚(电击)装置。以压杆和食物奖赏为例,定义一个压杆为药物1压杆,另外一个压杆为药物2压杆。当给动物注射药物1后,在行为训练的时候只有按压药物1压杆才能得到食物奖赏,称为正确压杆,另外一个是错误压杆;反过来,当给动物注射药物2时,按压药物2压杆可以得到食物奖赏,此时药物2压杆为正确压杆,另外一个为错误压杆。在进行辨别测试时,给动物注射一个未知药物,根据动物压杆间选择的比例来判断该未知药物更接近哪个训练药物。训练药物可以是生理盐水和药物、两种不同的药物、同一种药物的不同剂量、甚至是同一药物的不同异构体等。
为了有足够时间清除体内药物,训练一般一天一次,有药和无药隔天交替或随机。每次的训练时间也不能太长,一般30分钟。训练的第一个反应周期反映了动物获得药物辨别行为的程度。主要有两个实验指标:建立稳定的药物辨别行为需要的训练时间以及辨别准确度;替代实验(substitution test)也是常用的测试手段。
(三)结果与解释
大多数作用于中枢神经系统的药物(75%)都具有辨别效应,对于滥用药物几乎是100%。而仅仅作用于外周的药物检测不到辨别效应。药物辨别实验具有很高的灵敏度,只是剂量越小,需要的训练次数也越多。反应药物的辨别能力主要是3个指标:达到训练标准需要的训练次数、能达到的准确度以及替代能力。药物辨别也有很好的特异性,不同类别的药物具有完全不同的辨别效应。
除了以上优点,药物辨别实验也有不少缺点,首先是实验一般需要很长的实验周期,通常需要1~3个月,因而实验劳动强度大。其次,作为一个研究药物滥用的动物模型,如果仅从精神药理学角度来讲,药物辨别几乎没有任何模型表面效度。药物滥用主要是基于药物的强化效应(例如主观愉悦感),如果药物辨别也部分基于药物的主观感觉,那么就和药物滥用具有共同的基础,表现出部分表面效度。主观感觉可以分为3类:愉悦感(促进滥用)、厌恶感(抑制滥用)、中性感觉(与滥用无关)。然而研究表明依赖潜力和辨别效应的相关性并不强,也就是说并不是依赖潜力弱的药物辨别刺激也弱。
四、脑内自身刺激
通过物理学或化学手段直接激活大脑的特定脑区具有强化效应,这个现象称为脑刺激奖赏(brain stimulation reward),刺激包括电、药物以及现代流行的光遗传技术。激活的这些脑区称为奖赏通路,也是成瘾的核心中枢,自然奖赏、药物奖赏也都是作用于该通路。脑刺激奖赏是研究中枢奖赏机制的重要手段,脑内自身电刺激(intracranial self-stimulation,ICS)是一种研究脑刺激奖赏的操作性实验方法,大多数成瘾性药物都可以促进脑内自身电刺激行为,因此也被用于药物依赖性潜力评价。
(一)历史
1954年,McGill大学的两个博士后James Olds和Peter Milner给大鼠特定的脑区埋置刺激电极,通过训练,大鼠可以通过压杆来主动获得电刺激,说明电刺激特定的脑区具有正性强化效应,证实脑奖赏通路的存在,James Olds也被认为是现代神经科学的奠基人之一。后续的研究发现脑刺激奖赏现象存在于很多不同的动物种类,例如豚鼠、猫、狗、羊、金鱼以及灵长类猕猴,也包括人。
早期的研究主要回答两个问题:刺激哪些脑区具有奖赏效应以及什么药物可以影响这些奖赏效应?这些研究证实脑奖赏通路是一个分布式的、多突触联系的通路,自然奖赏通过视觉、听觉、味觉、嗅觉以及触觉等外周刺激激活了奖赏通路,而脑电刺激则是直接激活奖赏通路。内侧前脑束(发自中脑腹部,经过外侧下丘脑,投射到外侧核视前区)是最稳定的可以建立和维持脑内自身电刺激的中枢部位。脑内自身电刺激或脑内自身给药技术成为研究边缘系统以及多巴胺系统奖赏功能的重要手段。
(二)实验方法
脑内自身电刺激实验在操作箱里进行,通常配备的输入设备是压杆,当然首先是需要给动物(通常用大鼠)埋置刺激电极。一般采用FR1连续强化程序建立自身刺激行为,即大鼠每压一次压杆就可以触发一个电刺激,刺激参数主要是要确保最少的组织损伤和最稳定的行为。大强度、固定极性、连续刺激一个脑区很容易引起组织损伤,因此常用尽量低的刺激电流及极性交替的脉冲刺激(持续时间大概500毫秒)。
影响脑内自身电刺激行为的因素很多:刺激位点、刺激电极(大小、规格)、刺激参数(波形、极性、电流大小、脉冲频率、脉冲宽度、刺激维持时间)、强化程序、动物的性别、动物的行为训练经验,如果是评价药物的影响还有给药剂量等。
(三)应用
脑内自身电刺激主要有两个应用,一个是用于研究脑奖赏通路和脑奖赏刺激的机制,另外一个应用是评价药物依赖性潜力,后者的应用更为广泛,研究也更深入。大多数成瘾性药物可以促进脑内自身电刺激行为或者降低刺激阈值。然而也有例外,例如吗啡不是所有的剂量下都是促进脑内自身电刺激行为的,在一定的剂量范围可以减弱自身脑电刺激行为,不能因此而得出吗啡成瘾潜力低的结论。
与其他动物模型相比,脑内自我刺激技术在药物滥用研究领域中应用的广泛性不如自身给药、条件性位置偏爱和药物辨别。该方法的优点是实验训练相对容易,而且反应性高度灵敏,例如对于低强度的电刺激,电流微小的增加就显著促进行为;苯二氮 类药物的依赖性潜力评价用其他方法比较困难,而该方法相对容易。

第三节 研究成瘾行为特征的动物模型

一、复发与重建
前一节描述的评价强化效应的动物模型主要是模拟了偶尔或连续用药的生物学基础,但这并非药物滥用和成瘾的核心特征,复发(relapse)是这些核心问题中的一个,指的是停药(abstinence)一段时间后再次用药/觅药行为。复发是一个习得行为,其神经生物学基础是各种动机刺激的神经适应过程。与人类药物滥用行为类似的停药/复发现象在动物模型中最接近的是操作行为中的消退/重建(extinction/reinstatement)现象。
(一)消退
消退(extinction)是一个心理学概念,对于操作性条件反射,如果停止给予强化刺激(例如药物被生理盐水替代),行为会逐渐减弱并消失;对于巴甫洛夫条件反射,如果条件性刺激出现后不再有非条件刺激,条件反射会逐渐消失,这是正常的生物学过程。与创伤应激障碍相关的恐惧记忆不容易消退一样,成瘾行为被认为是渴求相关记忆,同样不容易消退。消退的机制一直是个争议的问题,一个观点认为是关联学习的“去学习”过程,另外一个观点是新的行为抑制学习过程,还有一个观点是习惯化(habituation)过程,但有一点是明确的,消退肯定不是忘记。
斯金纳在训练大鼠时偶然发现了消退现象,因为机械故障食物卡住了而当时他又不在实验室,大鼠按压杆得不到食物,结果是记录到了令他非常兴奋的压杆曲线,食物停止后,反应曲线开始是突然增加,这个现象后来被称为消退反跳(extinction burst),后来压杆逐渐减少,直至大鼠不再压杆。完整的消退训练要求有足够的训练时间和次数,每次2小时,通常2周以上,而且消退过程尽量避免出现原来的各种条件性刺激信号(如灯光、声音等)。
(二)重建
在操作条件性强化训练过程中,对于已经消退的反应,如果再次给予一个刺激(例如自身给药训练用的药物或条件性信号),原来的行为会重新建立起来,这个现象称为重建(reinstatement)或恢复,给予刺激这一个过程称为“点燃”(priming)。点燃刺激的动机效应不仅是恢复原有的操作行为(如压杆),还会激活一系列其他过程,例如大鼠运动量开始增加,而且会围绕压杆转来转去,甚至牙咬压杆等。说明一个短暂的点燃刺激就可以改变动物对环境的反应性。利用此现象,为了加快训练进程,有的自身给药训练每次实验开始的时候会先自动给动物注射一次药物,使动物能提前“兴奋”起来。
(三)实验方法
消退/重建实验流程大都应用于静脉自身给药实验,也有一些报道应用于条件性位置偏爱。以静脉自身给药实验为例,实验流程如图5-2所示。首先是自身给药训练,一般是2周(如果实验室周末休息,共训练10天);接着消退训练2周,动物放入实验笼,只记录反应;第15天给予点燃诱导。这个实验设计是最常用的“训练间”(between-session)设计,这个设计对于同一个诱导因素来说通常只能测量一次,如果反复测试反应会快速下降。还有一种就是“训练间/训练内”(between-within)设计,自身给药训练结束后,先停药一段时间(abstinence),消退和诱导测试在同一个测试期内完成。
图5-2 消退/重建模型实验流程
(四)诱导复发的因素
行为重建常用的诱导因素有3个。
1.药物点燃(drug priming)
自身给药行为消退后,如果通过外周或中枢人工给予一次训练用的药物注射,能够非常稳定地点燃已经消退的自身给药行为。一般使用的剂量比自身给药期间的单次给药量大,反应强度与剂量成正比。点燃用的药物一般是训练用的药物,或具有相同药理作用机制的同一类药物。也有交叉点燃的报道,点燃用的药物和自身给药训练的药物在药理学上属于不同类别。
2.药物相关的环境线索(drug-relatedenvironmental cue)
训练用的笼子,药物注射相伴的灯光、注射泵的声音等都可以诱导行为重建,环境信号可以分为3种,涉及的中枢机制有所区别。
(1)实验笼环境线索(context cue):
消退训练需要使用一个完全不同的环境,消退程序和自身给药训练一样,灯光声音都在,唯一的区别就是没有药物注射,行为消退后,当动物重新返回原来的训练环境,反应又重新被诱导出来,这个方法又称为“renewal procedure”。如果不经行为消退,停药一段时间直接把动物放入原来的训练笼进行测试,结果是停药实验越长(大概2周~1个月),反应越强,这个现象被称为“潜伏(incubation)”。
(2)间断的环境线索(discrete cue):
指的是与药物注射相伴的环境刺激信号如声音(注射泵)、灯光等。测试前需要进行行为消退训练,测试用的这些环境线索不能消退,否则无法进行后续测试。
(3)辨别线索(discriminative cue):
辨别线索不同于前二者的是,只有当这个线索信号出现的时候,反应才得到强化。例如用两个不同频率的声音,其中一个频率出现的时候反应得到奖赏,另外一个频率出现的时候反应得不到奖赏。这个信号也可以用来诱导行为重建。
3.应激(stress)
应激模拟了生活中的负性事件,这通常是导致复发的原因之一。足底电刺激是最常用的应激方式,应激和环境有关,通常只有在训练笼中给予足底电刺激才能诱导觅药行为,通常测试前15分钟连续给予电刺激。食物剥夺也可以理解为一种应激事件,长期限制食物可以诱导觅食行为,而且也能增强药物诱导的觅药行为。
在海洛因自身给药和复发模型研究中,作者进行了一系列研究工作:发现觅药行为强度与摄入药物总量、接触的药物次数有关。药物成瘾行为是一个渐进而连续的过程,从偶尔用药(可控制的)到有规律用药(依赖)的过程,存在从“喜欢”到“渴求”的转变过程。作者发现海洛因从小剂量的10μg/kg增加到100μg/kg,连续训练2周后,药物线索诱导的觅药行为呈剂量依赖方式增强,表明药物线索诱导的海洛因复发行为与训练剂量存在正相关,决定转变的关键因素是接触药物量,也是决定戒断后复发行为强弱的关键因素之一。
二、行为敏化
(一)药物敏化现象
精神活性物质有一个明显区别于其他类药物的药理学特性,长期间断性地用药,药效会发生改变。大家最熟知的是阿片类药物的镇痛及欣快感耐受现象,反复用药后,机体需要比原来更大的剂量才能得到原来的镇痛效应或欣快感。耐受(tolerance)是剂量效应曲线向右移动;反之,如果该曲线向左移动,这就是敏化(sensitization)或反向耐受(reverse tolerance),又被称为药物敏化(drug sensitization)。绝大多数滥用药物如海洛因、可卡因、甲基苯丙胺、尼古丁、酒精等都具有药物敏化现象。例如,和大多数滥用药物一样,可卡因可以增加大鼠中脑伏隔核多巴胺的释放,反复给予可卡因后,多巴胺被激活的量和第一次给药相比显著提高。除了药物敏化,还有神经敏化现象,例如电或化学刺激海马导致的长时程增强(long-term potentiation,LTP)、电刺激杏仁核或海马导致的痉挛反应敏化(癫痫点燃模型)、脊髓背角伤害性神经元对外周伤害性刺激或炎症的敏化等。药物敏化是一个非关联性学习过程,虽然其中枢机制至今还不十分清楚,但大量研究表明,中脑边缘多巴胺奖赏系统参与其中,涉及一系列受体后信号转导系统和神经元的形态学与功能改变,即神经可塑性,因此很多研究采用药物敏化模型来研究药物引起的神经可塑性问题。
(二)行为敏化现象
药物敏化最容易观察到的是行为学改变,如自发活动和定势行为增加,又称为行为敏化(behavioral sensitization)。行为敏化现象源自苯丙胺神经毒性的研究。很早就发现苯丙胺类兴奋剂长期使用可以导致类精神病样症状,行为表现怪异和错乱。给实验动物长时间大剂量使用苯丙胺类兴奋剂导致初期的活动度增加,接着是刻板行为,到后来活动减少并出现“幻觉”,这就是脑内多巴胺耗竭所致的苯丙胺神经毒性症状。早期对苯丙胺神经毒性的研究多集中在自主神经系统方面的影响,20世纪60年代才开始关注到苯丙胺引起运行兴奋效应不仅不“耐受”,而且会“敏化”。1975年和1977年开始出现吗啡、可卡因运动敏化报道,但并未使用“行为敏化”一词。Post等在1981年发表在 Life Science的一篇论文标题里最早使用了“行为敏化”一词。20世纪80年代,剑桥大学Robinson实验室对行为敏化开展了一系列研究,并对行为敏化总结和给出明确定义:行为敏化是指反复、断续的接触药物后导致的精神运动(psychomotor)增加的现象。在此基础上,Robinson和Berridge提出了成瘾的动机敏化理论(incentive sensitization)。20世纪90年代,行为敏化成为一个热门学科和研究热点。
(三)行为敏化建立过程
行为敏化的建立通常分为三个阶段:药物处理、停药、表达测试。行为敏化形成速度因药而异,除了动物种属、性别、剂量、环境等实验因素,给药次数、给药间隔、停药时间等都是实验的重要因素。
1.给药次数
大多数行为敏化的建立给药次数为每天一次或两次、连续1~2周。给药次数因药而异,个别研究报道一次给药即可建立甲基苯丙胺敏化行为,而有的则需要给药长达数个月。
2.给药间隔
从行为敏化的定义“间断给药”即可看出,多次给药之间必须要有一定的时间间隔,这与研究药物耐受通常是采用连续给药有所不同。研究发现,不同的给药间隔,小鼠甲基苯丙胺行为敏化的强度也不同。
3.停药时间
以小鼠吗啡行为敏化为例,通常每天注射一次吗啡,剂量10mg/kg、连续7天,停药7天,第15天行为表达测试,绝大多数小鼠都可以检测到稳定的敏化行为。如果缩短给药间隔和停药时间,检测到的行为敏化强度会减弱。而对于苯丙胺来说,大多数实验需要停药后至少24小时才能检测到行为敏化现象。
4.实验环境
环境因素也影响行为敏化建立和表达的强度,对于大多数药物如吗啡、可卡因、甲基苯丙胺,在同一个环境下给药和表达检测,行为敏化的强度要大于不同的环境。据此可以分为环境依赖(context-dependent)的行为敏化和环境不依赖(context-independent)的行为敏化。
(四)行为敏化表达检测方法
1.运动敏化
运动敏化是检测行为敏化最常用而且也是简单的实验方法,观察的指标有两类,一是自发活动(locomotor activity),另一类是刻板行为(stereotype behavior)和异常姿势。自发活动一般是把动物放入一个方形活动空间里(大鼠实验区域边长35~45cm,小鼠实验区域边长25~35cm),运动区域画上便于计数的方格,给定的时间内,动物跨越方格的次数可以换算成运动距离。人工记录耗时耗力,现在自发活动实验基本采用自动化技术,从早期的红外线到目前的视频轨迹分析,大大节约人力。刻板行为和异常姿势目前仍然以人工记录为主,刻板行为由一系列不同的行为组成,不同的行为敏化程度不同。因为计算机智能识别有一定难度,动物在一个位置的往返运动以及抬头行为可以自动分析,其他如修饰行为、抬头、啃、咬、添、嗅等行为分析软件还不流行。
2.条件性位置偏爱和自身给药
除了常用的自发活动检测,行为敏化也可以用条件性位置偏爱和自身给药实验来检测。对于条件性位置偏爱,如果提前给予动物反复的药物处理,在后续的模型建立过程中,动物在伴药侧停留的时间会比没有给予药物前处理的时间增加。对于静脉自身给药,反复提前药物处理,动物自身给药行为建立的速度会加快,或者建立自身给药行为需要的药物剂量会减小。
需要特别指出的是,尽管行为敏化一直被应用于滥用药物的研究,而且本章把行为敏化模型放到“成瘾相关行为特征”一章论述,并不意味着它就是一个成瘾动物模型,因为到目前为止还没有发现行为敏化(运动敏化)和成瘾之间的直接关系。