第一章 巨型飞机的坠毁
“这是真的吗?”我在灯塔出版社的编辑发邮件给我,表示怀疑。那是2016年一个春日下午,她在邮件里附上了一篇来自《英国医学杂志》(British Medical Journal,简称BMJ)的文章,这篇文章激起了主流媒体的巨大关注(尽管它在学术界引发了可观的批评)。[1]这篇文章推断说,医疗过失[2]是美国的第三大死因。
我踌躇不决,不知如何回答她的问题,不只是因为我还没来得及读那些医学杂志——它们不依不饶地在我的诊所、信箱、电子邮件收件箱,哦,好吧,甚至在我的卫生间里堆了起来。
我踌躇不决,因为我确实没法回答她的问题。第三大死因?真的吗?医疗过失真的击败了乳腺癌、中风、阿尔茨海默病、意外事故、糖尿病和肺炎吗?
在贝尔维尤医院,美国最大型、最繁忙的医院之一,我作为内科医生已执业25年。我自认为,我看到的应是当前医学的一个合乎情理的横截面。我的绝大多数病人[3]患有来自21世纪“发达”社会的疾病——肥胖、糖尿病、心脏病、高血压和癌症。
如果医疗过失是第三大死因,那么我应该总能遇到它,对吧?我应该会从亲朋好友那里听说这样的事情。如果医疗过失是仅次于心脏病和癌症的致命疾病,那么它应该是我日常医疗经历的一部分。
但并非如此。
或者说,起码感觉上不是这样。
我当然目睹过医疗过失,我肯定也经历过医疗过失。我在医院走廊上听到过令人不寒而栗的传闻,我也在媒体上读到过触目惊心、令人心碎的故事。然而,这些事迹都像例外——罕见而恐怖。在我的临床实践中,医疗过失造成的死亡根本不像充血性心力衰竭、肺癌或肺气肿那样频繁出现。
然而,医疗过失的数据滚滚而来。从1999年美国医学研究院第一份报告[4]估计的医疗过失每年导致44 000—98 000例死亡,到《英国医学杂志》这篇分析提出的每年导致超过25万例死亡——医疗过失近乎突发公共卫生事件。即便这些数字并不完全准确(这些论文使用的方法论已受到质疑),研究人员也一致认为,医疗过失的数量一点也不少。
是这些数据错了,还是我错了?
是我——以及大多数医务人员——根本没看到医疗过失之猖獗吗?是我们心怀偏见,不肯接受现实?我们这些临床医生正在以前所未有的速度杀死我们的病人,但不知何故,对此漫不经心,丝毫没有察觉?如果确实如此,或许我们应该去除我们共同的带状疱疹[5],这样我们的病人就可以免受伤害。我们可以在门口贴一张纸条:“吃藜麦和豆子。爬楼梯。远离医疗保健系统。”
虽然“第三大死因”的说法很可能是夸大其词,但已公布的医疗过失的统计数据与普通临床医生的经历大相径庭。普通患者也是一样,他们的经历也不同于统计数据,只是层面不同。
作为执业医生,偶尔作为病人,我感到我必须把这件事情搞清楚。我的经历与已公布数据所做的推测似乎有天壤之别。我们中有人说错了,我的目标就是找到错的究竟是谁。
要是把过去两百年的医学史拍成一部故事片,那它将是一部惊心动魄的冒险史诗。身穿白大褂的英雄们挥舞着听诊器和吸量管,用其医疗砍刀一举斩下疾病的头颅。屏幕上,卫生设备、抗菌术和麻醉会从天而降,将19世纪的疾病夷为平地。20世纪初,疫苗和抗生素会像手榴弹一样爆炸——将平民大众从传染大盗的手中拯救出来。我们为之欢欣鼓舞的超级英雄会大摇大摆地进入20世纪下半叶,旋即用360度的柔术——化疗、透析、抗精神病药物、输血、避孕、CT扫描仪、心导管插入术、重症监护室、他汀类药物、降压药、艾滋病治疗——进行攻击,杀死房间里的每条龙,而几乎从不回头看一眼。这部电影会是一条逐步战胜疾病的笔直大道,在你还没来得及把手伸到油乎乎的爆米花桶底,抓到未爆开的玉米粒之前,人均预期寿命几乎翻了一番。
不可思议的成功一直是医学界的主旋律。理由很充分!把曾经整齐划一的杀手变成过眼烟云是一项了不起的成就,不该被视为理所当然。但是,这个持续不断胜利的主题并没有为谈论医疗过失和治疗的不良结果留下太多空间。医疗过失和治疗的不良后果充其量只是我们的英雄昂首阔步前进时那令人厌烦的绊脚石。
医学并不是不检查错误。一个世纪以来,并发症与死亡病例讨论会(Morbidity and mortality conferences,被亲切地称为M&M会议)一直是医学的一部分。M&M会议过去会,现在也会对治疗的不良结果进行正式评估。但是,我们医学英雄的粗犷的个人主义渗透到了我们对医疗差错的分析中,对此,我们通常的应对方式是,找出是什么——或者更多时候是谁——出现了问题,然后解决这个问题。尽管如此,在这种不可阻挡的前进感面前,这些过错无足轻重。在医学研究不屈不挠的进步中,所有这些问题都会得到解决。
因此,清点医疗伤害从来不是医疗研究中一个蓬勃发展的领域,这不足为怪。医疗界白发苍苍的权威人士认为,卓越的医学艺术——在势不可挡的科学研究力量的支持下——所提供的照护服务堪称典范。事实上,最早发现盲区的人,反而是医学实习生。
住院医师罗伯特·莫泽任职于布鲁克陆军医疗中心,他是第一批认真审视医疗服务不足之处的人之一。在1956年发表于《新英格兰医学期刊》的论文中,他描述了“一些不采用某种医疗手段就不会出现的疾病”。这可能是第一篇调查我们临床医生所造成的损害的论文——虽然是以良好医疗保健之名。他把这篇论文命名为“医疗进步的疾病”,并发现约有5%的患者经历过这种疾病。[6]
几年后,在耶鲁—纽黑文医院住院医师的一次晨会上,恰好讨论了这篇论文。当天出席会议的住院医师里有伊莱休·席梅尔,彼时他的主要学术成就是在位于布鲁克林波罗园的埃兹·查伊姆神学院[7]荣获了一枚塔木德学习领域的金牌奖章。
席梅尔突然冒出了一个令人不安的想法,即他所学习的医学在行善的同时,也会造成伤害。在培训期间,他开始在记分卡上做记录,记下任何他认为是由他提供的医疗服务所引起的并发症或不良后果。
经过三年培训,席梅尔被选为1960—1961学年的住院总医师。耶鲁有一个传统,要由住院总医师承担一个研究项目,席梅尔决定拓展莫泽的工作。莫泽回顾性地检视了他的病例,而所有的回顾性分析——好似事后诸葛亮(Monday morning quarterbacking)——都充斥着偏见。席梅尔希望在科学上更加严谨,前瞻性地研究这一问题。他会实时记录患者因其医疗护理而遭受的并发症的数量。“这在当时是第一个同时产生分子和分母的研究。”席梅尔自豪地告诉我。
开展这项研究的基层员工就是构成耶鲁医疗住院项目的33名住院医师。“很明显,这在外科服务中是行不通的。”他回忆道,轻声笑了。他感觉更加寡言少语的外科部不会热衷于摊开丑事[8]。
从1960年8月1日起,每位患者的病历前面都贴上了一张表格。住院医师要记录下任何意外事件,即便它是由必要的和可接受的治疗或检查导致的。席梅尔特别排除了无心之失导致的事件(例如不小心抓错了药)。他更关心医疗保健本身带来的伤害。在接下来的八个多月里,这项研究持续进行,有一千多名患者参与进来。
住院医师记录了198名患者身上发生的240起不良事件。也就是说,约有20%的患者遭受了由医疗护理引起的某种伤害。这个数字是惊人的。在医疗领域,没人能预料到,他们做的事情会伤害每五个病人中的一个。
事实是,在脏衣服部,亦即医学部,人们和外科部的人一样闷不吭声。席梅尔所在部门没有一个资深教员提出要担任该论文的共同作者,这在住院医师承担研究项目时可不是常有的事儿。于是,席梅尔独自撰写了这篇论文。
看起来,医学领域总的来说就不太热衷于摊开丑事。他被告知,“《新英格兰医学期刊》不发表这类稿件”。他这篇写于1964年的论文屡次被拒,最终发表在《内科学年鉴》上。[9]
无论是席梅尔论文所谈的话题,还是“住院治疗的危害”这一标题都没有为他赢得多少人的青睐,尤其是在像耶鲁这样的常春藤盟校。一年前,他发表了一篇关于医源性疾病——也就是医生引起的疾病——的颇为挑衅的评论,就已经引起了医院领导层的不满。[10](那篇文章的标题起得很妙,叫作“作为病原体的医生”,很有讽刺意味)。当席梅尔在病例研讨会上介绍了他关于“住院治疗的危害”的研究结果后,医院院长把他拉到了自己的办公室。院长要求他解释:“你说的纽黑文医院的事情,是什么情况?”
“危害与医院的建筑无关,”席梅尔冷冷地说道,“医院并不行医。”他没再多说下去。
直到20世纪80年代,研究人员才开始在更大范围内审视医疗伤害。不过,研究的角度并不是真正意义上的患者安全——这个词当时甚至还没有发明出来——而是美国的医疗失当[11]体系。医生是否被起诉得体无完肤?患者是否有足够的钱支付不断飙升的医疗费用?那些没有机会上法庭的患者怎么样了?这些问题都没有答案,因为没人真正知道问题的严重性。有多少患者在医疗系统中受到伤害?这些伤害有多严重?这些是良好医疗保健的“副作用”,还是与公然疏忽有关的不良后果?有何经济影响?
哈佛医疗执业研究是最早对这些问题进行严格检视的研究之一。[12]研究者在1984年一整年对纽约州的51家医院开展调查。(如果要摊开丑事的话,哈佛大学的研究人员可能更希望丑闻来自纽约,而不是来自他们自己的位于马萨诸塞州的医院!)他们随机选择了30 121份病例,记录了其中出现的不良事件的数量。根据他们的定义,不良事件为医疗护理造成的意外伤害。研究发现,3.7%的住院治疗引起了医疗伤害,其中14%是致命的。如果将该研究结果推延至纽约州所有居民,这意味着1984年医院保健导致的伤害有近10万例(包括13 451例死亡和2550例永久伤残)。
该研究的作者之一是一位名叫卢西恩·利普的小儿外科医生,他对患者受到的伤害之大感到愕然,就此放下手术刀,用余生钻研这些数据。他尤其感到震惊的是,约有三分之二的伤害被认为是可以避免的。此外,该研究只记录了导致重大伤害的过失。这无疑意味着那些仅仅造成轻微伤害的过失未被注意到,而它们的数量要多得多。那么,所有那些没有造成伤害的过失呢?过失还是过失,代表着更大的潜在灾难的雷区。
1994年,利普发表了一篇开创性的文章,将医疗过失的研究重点从医疗失当体系转向了使医疗保健更安全的总体目标。[13]首先,收集数据时需关注过失的总数,而不仅仅是那些造成伤害的过失;医务人员不能因为过错侥幸未给患者造成伤害就高枕无忧。然而,利普首要的主题是,过失通常是系统故障的结果,而不仅仅是个人的失败。即使过失的直接原因实际上是人的行为,比如护士用错了药,你也几乎总能发现使过失成为可能的系统问题的层次。
在这个例子中,可能是护士需要负责的病人太多,或者她的思绪经常被警报器打断,或者药物的名字听起来相似,或者各个病房把药物存放在不同位置,或者在荧光灯的强光下看不清严重反光的标签上的字。在发生医疗过失后,医院通常的应对方式是惩戒护士或强行开展补救培训,而利普的想法是,如果医院真的想避免未来的错误,它就必须更深入地挖掘系统,找出是什么使护士的过失成为可能。他写道,“必须认识到,过失表明存在缺陷的是系统,而非个人”。
利普强调的第二个主题是,医疗过失是不可避免的。他认为,医疗保健系统“依靠个人不犯错,而非假设他们会犯错”,这是个根本错误。他对认知心理学和人因学研究领域(侧重于研究人类和机器如何互动的工程设计)很感兴趣。通过了解人类在特定情境下如何思考和反应,我们可以了解到我们如何以及为何会在医疗中犯下很多典型错误。有了这些信息,我们就可以重新设计出一个让人们更难以犯错的系统。
(利普文章的第三个“中心思想”是,他观察到,如果将哈佛医疗执业研究的致命伤害推延至整个美国的话,等同于每天都有1.5架[!]巨型喷气式客机坠毁。坠毁的飞机就这样变成了刚刚萌芽的患者安全运动的关键隐喻。)
1999年,美国医学研究院发表了开创性报告《犯错乃人之常情》,利普正是这份报告的作者之一。许多人把医学研究院的这份报告视作现代患者安全运动的创始文件,谈论它时就像谈论死海古卷或美国宪法一样满怀敬畏。《犯错乃人之常情》强调,医学需要做更多工作,使医疗系统变得更安全,而非指责犯错的个体。医学研究院的这份报告被泄露给了媒体,报告中所估计的每年有多达98 000名美国人死于医疗过失成了新闻焦点。巨型喷气式客机的隐喻无处不在,新闻工作者一有机会,就会使用飞机失事的显眼图片。
然而,与流行观点不同,《犯错乃人之常情》并不是调查研究报告。没有人披上夏洛克·福尔摩斯的斗篷,开始在急诊室窥探指纹。也没有人偷窥手术室或跟在护士后面查房。更没有人钻研病历或观看尸检。医学研究院的这份报告采纳了哈佛医疗执业研究(作为纽约人,我感觉有责任指出,这份报告本该叫作纽约医疗执业研究)和在犹他州与科罗拉多州做的类似调查[14]的数据,并将这些数据推延至整个美国。每年98 000例死亡这个被广泛引用的数字源于将纽约州换算为整个国家(当然,我们纽约人早就知道这是真的)而进行的数学计算。如果美国仅仅由像犹他州和科罗拉多州这样人烟稀少的长方形州组成的话,每年因医疗过失而死亡的人数将是48 000人。因此,根据医学研究院的这份报告,官方估计死于医疗过失的人数在48 000到98 000之间。
下限数字很快就在媒体炒作中消失了。几乎所有其他细微差别也是如此。人们所讨论的都只是医生是如何每年杀死98 000个美国人的。被媒体忽视的其中一个最重要的事实是,医学研究院的这份报告所基于的两项主要研究都关乎住院患者。而大多数人并非在医院里接受医疗服务,因此,现有数据并不具有普遍性。住院患者,顾名思义,他们比一般人群更不健康,通常年纪也更大。和一般人相比,更不健康的患者需要接受更多治疗,吃更多药,做更多手术,并和更多医务人员打交道——在本书中我将多次提到这一点。在所有这些事项中,即使其中99%善始善终,鉴于围绕住院患者展开的活动部件之庞杂,也几乎可以肯定,这些杂事中起码有一件事不会按计划进行。
第二个被遗漏的细微差别在于可预防性问题。最初的研究没有着手确定可以预防的过失的比例——他们研究的是医疗伤害和医疗失当案例。当研究人员回过头来,希望提取相关信息进行分析时,他们只能找到病例概要,而非原始病历。许多细节丢失了,因而研究人员自己也很难就什么过失被认为是可预防的达成一致。
另外,可预防的过失和可预防的死亡是截然不同的两件事。例如,一名死于终末期肝病的患者可能被给错了抗生素剂量,那么,这名患者既经历了可预防的过失,也遭遇了死亡,但这两件事未必相关。校正抗生素剂量,即防止错误,并不会改变肝病致死这一事实。弄清楚一个过失是否真的导致死亡,需要经过复杂的分析。所以,是的,98 000名死者可能在接受医治时经历了过失,但这些过失是否导致他们死亡?医学研究院的这份报告无法回答这个问题,而媒体也不会对此费心剖析。这个新闻标题实在是太有料了,让人不忍错过。
很有可能,我们的不当行为并没有导致每天都有一架载满患者的巨型喷气式客机在美国国土上坠毁。这个数字可能更小。但不是零。即使每年估计的因医疗过失而死亡的98 000人实际上应是50 000人或20 000人或5000人,死于我们行为的患者人数还是太多了。此外,医疗过失导致的死亡只是受到过失伤害的患者的一小部分。那些由于过失而导致出血、肾衰竭或血凝块的患者呢?这些都是严重伤害,即使它们不会导致死亡。另外,我们现在也开始把诊断错误和诊断延迟视为过失,从而扩大了“可预防的伤害”的范围。
因此,尽管美国医学研究院的报告可能并不完全准确——当然,新闻媒体也抹去了这份报告的分析的任何微妙之处——但它成功地将医疗领域和公众的注意力都集中在了患者安全问题上。它也让资助基金的车轮滚了起来,使研究人员能够像研究其他对人类造成伤害的疾病那样深入研究医疗过失。《犯错乃人之常情》的原版可能不如披头士乐队的《白色专辑》(White Album)的原版唱片那样打动你,但它最终达到了它的目的——启动患者安全运动。
在医疗行业,经常有人告诉我们,要向航空业“学习”。考虑到现代航空公司的状况,我想我一定不是唯一一个希望我们不要在伸腿空间或行李费用方面有所借鉴的人,但我们肯定可以从航空“同行”身上学到很多东西。航空业起步时和医学一样,是一个为坚定的个人主义者开放的实验室,敢于冒险的特立独行者在这个实验室里与重力和物理学做斗争。但转折点在1935年出现了,就是那个如今家喻户晓的关于B-17“飞行堡垒”轰炸机的故事。B-17“飞行堡垒”轰炸机是当时最先进的飞机,是为了让美国军队在世界范围内保持战斗力领先而开发的。它比之前的任何飞机都更大、更快,并在驾驶舱内配备了史上最复杂的控制系统。然而,处女航时,它在起飞后30秒就爆炸了。后来确定,飞行员忘了解除机翼可动襟翼(即控制面板)上的锁。
如果这是一个医疗案例,飞行员会站在M&M会议的讲台上,羞愧地讲述他怎么会忘记开启控制面板的。为前线人员鼓舞士气的资深医生会拿着放大镜打手势,详细说明未运转的控制面板是如何阻止飞行员调节飞机的俯仰的。这样的话,飞机将会卡在一个固定角度上,飞行员无法进行调节。这类似于开车时,车轮卡在一个方向上,使汽车无法转向。
在讲台上,当有人煞费苦心地解释病理生理学,并将通往灾难的必经之路展示给所有人看时,飞行员将始终一言不发。甚至无须旁人开口数落,就能完成对他的鞭笞。一半听众会想,“真是个蠢货”,而另一半听众则伸手去拿念珠,喃喃自语,“感谢上帝,在驾驶舱里的那个人不是我”。
这种情况没有发生,不只是因为飞行员不幸在爆炸中丧生。这没有发生,是因为尽管人为错误被视为坠机的直接原因,但错误并未被归咎于飞行员不够好(作为整个美国陆军飞行测试的负责人,这位飞行员拥有比大多数人更多的专业知识)。更确切地说,对人为错误的诊断被归因于一个系统拥有的活动部件太多,以至于事实上,一个人无法面面俱到。这架高端喷气式飞机有如此多先进、新奇的小玩意儿,飞行员根本无法跟踪全部。在医学研究院发布《犯错乃人之常情》的65年前,航空业就做出了决定性的转变,从关注作为错误源头的个人,转向关注可能导致错误的系统。
根据这一经验,航空检查清单应运而生。几十年以来,这份检查清单一直在调整,但使用检查清单的惯例一直存在。随着这种偏向技工式的飞行方式的出现,驾驶飞机的神秘感渐渐消失。另一方面,这种更严格的方式提高了飞行的安全性。例如,B—17轰炸机再也没有发生过那样的事故。总体而言,飞机失事和乘客死亡的数量稳步下降。
医学检查清单的想法也不时在各个学术圈中突然出现。它从未获得太多关注,因为比起航空业,医学被认为要复杂得多。医生一想到检查清单就备感不快——他们不是飞行员那样的技工!人们无法将科学、艺术、直觉和病床边举止的魔法列在清单上,而正是这些造就了最伟大的医生。
直到2001年,就在医学研究院发布了这份报告之后,清单才在医学界发挥了相当大的影响。这主要是因为清单制定者彼得·普洛诺福斯特并未试图列出复杂的医学魔法的清单。他选择解决仅一项具体任务——中心管,目的是消除仅一种不良结果,也就是导管相关感染。
中心管是指当患者需要大量输入液体和药物,或在大量医疗护理后小静脉已经耗尽时,插入身体的主要静脉(颈静脉、锁骨下静脉、股静脉)的大口径导管。这类需要使用中心管的患者往往病情严重,常常是在重症监护室里。如果这些导管受到污染,细菌会很快压垮这些已然身陷险境的患者(在接下来的章节里,我将以一位名叫杰伊的患者为例进行描述)。在普洛诺福斯特当时工作的约翰斯·霍普金斯医院的重症监护室里,11%的使用中心管的患者出现了感染。
普洛诺福斯特的检查清单看似相当荒谬——洗手,清洁患者皮肤,用无菌悬垂盖住患者,穿上无菌服,当你穿好后,再给患者无菌换药。仿佛他是在核对刷牙步骤的清单一样。大家都知道怎么刷牙——你可以无意识地完成刷牙——那么检查清单有什么用呢?
他在重症监护室里开展的实验如今已成为传奇,因为他所在医院的中心管感染基本下降为零。[15]而在密歇根州将近100家重症监护室里试用这张检查清单时,感染率也在三个月内骤降,近乎为零。[16]这简直好得令人难以置信。
一个国际合作项目创建了一项类似的手术室检查清单,项目参与者包括普洛诺福斯特的同事马丁·马克里发表于BMJ的关于“医疗过失是第三大死因”的论文作者之一)和来自波士顿的外科医生兼医学作家阿图·葛文德。该清单由19项组成,包括诸如介绍团队中每个人的名字和角色这样的基本事项。也包括意料之中的事项——确认患者姓名、外科手术类型和过敏情况,确保可以进行静脉输液和输血,术前术后清点所有器械和海绵。还有需要想一想的事项,比如,事前大概描述一下可能导致的并发症。从伦敦、西雅图到坦桑尼亚和印度,他们在全球范围内,找了八家医院进行测试。并发症的发生率从11%下降到了7%,死亡率从1.5%下降到了0.8%。[17]
清单得到了新闻媒体的热烈报道——这是一种简单、技术含量低的干预措施,可以防止所有这些巨型喷气式客机从空中坠毁,并很快被视为解决所有患者安全问题的答案。毕竟,检查清单显然已经解决了航空领域的所有问题。从经营者的角度来看,清单最理想不过了——成本低廉,措辞明确,易于实施。你要做的就是向你的员工分发一页纸。从预防血凝块、治疗中风到讨论DNR(do-not-resuscitate orders,拒绝心肺复苏术)和诊断脑死亡,医院开始为所有事项列检查清单。甚至在从医院的自动售货机上买零食时,你都无法不遇到清单。既然经营者如此喜欢清单,那么你可以想象政府官员会有多喜欢它们了。
2010年,安大略省卫生部强制要求省内所有医院都要使用外科手术清单。毕竟,如果坦桑尼亚人都能和伦敦人一样成功用上清单,那么在遵礼守法的加拿大,这应该易如反掌。研究人员几乎收集了政策执行前后省内所有医院的数据,准备向世界展示如何大规模改善医疗效果。
结果出人意料。尽管安大略省规范使用清单的比例达到92%—98%,但情况并无丝毫改善。死亡率没有变化。并发症发生率一如往常。无论研究人员如何对数据分门别类——按年龄、性别、手术类型、敏锐度、医院类型——在开始使用清单后,没有一组数据有所改善。[18]
这怎么可能?在新德里拥挤的慈善医院、在西雅图优雅的大学医院使用的同一份有效的清单,怎么会在理智的安大略省完全没有进展?答案在于这样一个事实:我们人类迷恋朗朗上口的解决方案(例如简明清单),但对让解决方案发挥作用的混乱过程兴趣寥寥。彼得·普洛诺福斯特会第一个告诉你,根除中心管感染的并不是他那张有五个勾选框的纸。根除感染需要医学文化的广泛改变,这是一件艰苦、乏味、毫无新闻价值的事情,而且在医学试验场上并未广受欢迎。
当普洛诺福斯特启动项目时,他必须做的第一件事就是说服他的同事,中心管感染是一项可以预防的伤害。如今这似乎有目共睹,但在当时,大多数医学专业人士认为这些感染是不可避免的,以一定比例发生在病例中。就像药物的副作用,感染是一些患者经历的不幸后果,你要做的仅仅是权衡使用中心管的利弊。将中心管感染视为可以预防的伤害,需要对惯性思维进行重大调整。
他必须做的第二件事是说服人们对感染率进行实际测量。你可能认为这也是明摆着的事情,但许多医院对这个问题的严重程度(或问题所在)毫无概念。
第三件(也可能是最重要的)事情是沟通的规则必须改变。把爆炸新闻推上台面的绝非清单。我的意思是,每个医生都知道在插入中心管之前你必须洗手。每个外科医生都知道,在开始手术前,你必须确保可以使用静脉输液。但在清单上明确这些事项后,团队成员不得不真正地谈论它。真正的困难(也可能是最终被视为普洛诺福斯特原初清单的秘诀的)在于护士被赋予大声说话的权力。
这是一次空前的文化转变。这并不是说护士的形象如20世纪50年代那样,是温顺的绵羊,胆怯到不敢对任何事情发出一丁点儿声音。而是说,在纷繁事务中,每天都要做成千上万个微观决策和微观互动,每个护士都必须掂量,什么时候值得破坏计划。许多医生对护士呵斥他们诸如要洗手之类的看似很小的麻烦事反应不佳。但护士是能够看到现场情况的人,他们有可能会成为改善现状的关键。
然而,仅仅告诉护士,如果医生没有完成所有五个步骤,他们有权大声说出来,这是不够的。要获得真正的权力,就要得到医院管理层的支持。护士被赋予权力,可以阻止任何不遵守正确流程的行为,而会议室里西装革履的理事承诺会支持他们。普洛诺福斯特在自己医院的第一次试验中告诉护士,他们可以不分昼夜地呼叫他,而他都会亲自支持他们。
在接受《纽约时报》采访时,普洛诺福斯特指出,“在每一家医院……病人都是因为等级制度而死去的”。[19]任何医疗工作者都必须退后一步,充分领会这句令人警醒的话。感觉难以开口的不仅有护士,还有家属、医学生、文职人员、护士助理——所有这些在医疗等级中地位较低者,他们在反驳资深医生时常常感觉不太舒服。但是,当涉及防止医疗过失时,这些人都身处第一线,他们往往是那些看到真实正在发生的事情的人。然而,要反抗根深蒂固的等级制度并不容易。
我在读医学院三年级时,曾为一台深夜进行的手术提供过协助,突然,外科医生的针不小心扎到了我的手指(我当时拿着个肝脏或是一些杂乱的肠子,离得远远的)。从那些面罩后面瞥过来的眼神中,我无法分辨还有谁注意到了。我想也许护士看到了,但我无法确定。没有人说话。此后,手术似乎拖拖拉拉做了好几个小时,这整段时间里我僵在原地,盘算着我是否该说些什么,怎么说。直到最后,我也没有鼓起勇气,从我作为医学生的卑微位置回击等级制度那死一般的沉默。在艾滋病流行的高峰期,手术期间我把受伤的手指浸在血液中,然后在接下来的数周和数月里,为被迫忍受反复的艾滋病病毒检测而焦虑不已,这让你隐约知道,当系统希望你闭嘴,别制造麻烦时,要大声说出来是多么困难。
如今常常被称为患者安全运动之父的卢西恩·利普,在安大略重症监护室的研究败坏了人人都有清单的计划之后,撰写了一则严肃评论。他说:“关键是要认识到,改变做法并不是一个技术问题,只要在清单的方框里打钩就完事了,而是一个关于人类行为和互动的社会问题。”[20]当关注点变成了清单本身而非正在行动的人时,什么都实现不了。“博弈是普遍存在的。”利普写道,特别是在清单是自上而下强制执行之时,安大略省的情况就是如此。正如我们在医学上所说的,所报告的92%—98%的依从率是博弈的症状。98%的依从率仅仅意味着,在98%的时间里,有人打钩了。仅此而已。
这就把我们带向了问题的真正原因:为何一些清单奏效,另一些则不,或者说为何任何干预措施——防止医疗过失、预防疾病、改善健康、提高效率——有效或无效。这实际上完全取决于干预措施是如何在实地完成的,也就是技术官僚所谓的实施情况。这是医学枯燥的一面,远不及开创性研究或戏剧性的救命措施那样激动人心。但正是这些单调的后勤工作,使得干预得以发生:物资放在哪里?具体什么时候做手术?会为此分配额外的时间吗?谁负责确保它会发生?会有人向工作人员解释为何会有这些变化吗?出现问题时你会找谁?谁会为这一变化提供支持和声援?究竟需要测量什么数据才能确定它是否有效?有人会得到这方面的反馈吗?有人考虑过可能会出现的意外后果吗?有人会提供咖啡吗?
实施清单很长,非常详细——它本身就是一个清单!——但如果这些问题得不到解决,无论是清单还是什么别的干预措施都注定会失败。一天早上,在诊所里,我在为当天的第一位患者看诊时,注意到电子病历看起来有点不一样。很明显,在凌晨时分进行的各种更新推出了一些“新功能”,现在,一堆东西乌七八糟地混在了一起,令我犯错了。
我的手指有肌肉记忆,比如,当患者说西班牙语时,它就知道,西班牙语在系统里对应序号41,而西班牙语是我们最常用的第二语言。记住这个数字,就让我省去滚动整个列表的烦恼。但不知何故,在这次更新中增加了一门语言,无意中把西班牙语排到了第42位。而我的手指仍然打出了41,所以当天就诊的每位患者都说塞尔维亚语。
随后,突然间,跳出来三个全新的、我之前从未见过的字段:乳胶过敏、食物过敏、环境过敏。一直以来,我们都有过敏字段,是必填项,你可以输入任何过敏类型——药物过敏、食物过敏——甚至是任意字段的其他类型的过敏(我有几次很想写“电子病历过敏”,不过克制住了)。现在这三个全新的必填字段突然出现,要求我注意。
哎,我并不认为乳胶过敏、食物过敏和环境过敏不重要,可是它们的首次露面不合时宜,让艰难的一天雪上加霜。我一般会在患者离开诊室时录入我的大部分笔记,以免在患者拜访时,电脑成为焦点。但现在我遇到了这些新字段,就可能面对这样的场景:我冲出诊室,挥手拦下正要踏入电梯的患者,语无伦次地喊着乳胶手套、猕猴桃和猫皮屑,也正是在同一天中,每个人都突然说上了塞尔维亚语。
我意识到,电子病历中的这些新增字段是用来预防医疗过失的干预措施。它们出现在那里,是为患者所做的善意努力的一部分,以避免在患者过敏的情况下使用乳胶手套,或确保工作人员不会在节日期间无意中使用豚草[21]树枝装点医院大厅。但我发现自己被整个过程激怒了。这家医院已经在用无乳胶手套了,因此,这一努力的潜在产出极低。但填写这些方框占用的时间,本可以用于关注糖尿病和心脏病等真正威胁患者安全的疾病。
你可以肯定,这项工作百分之百合规——这是必填字段,所以没有医生可以在输入框空白的情况下关闭笔记。在某个办公室的某个地方,有一个中层管理人员自豪地向他的上司报告说,医务人员“100%合规”。这种努力是否真的推动了我们医院里的患者安全事业?我对此深表怀疑,因为几乎每个人都沮丧地认输了,而仅仅对乳胶过敏这个问题点击了“否”(同时伪造了对食物过敏和环境过敏问题的答案)。
当时,我认为这整出事件只不过是电子病历带来的又一件烦心事,也是粗心大意的行政管理的又一个例子。但在回顾了清单使用经验之后,我认为这是一起实施的灾难。这是一项值得称道的患者安全干预措施,却对实施缺乏丝毫关注。没有任何人预先告诉我们,我们必须开始询问患者是否对乳胶过敏,或者我们说西班牙语的患者会用塞尔维亚语喋喋不休。没有人仔细想过,调整成百上千位医生不假思索操作的流程会带来意想不到的后果。没有人想过这会用掉多少时间。似乎没有人权衡过在一家不使用乳胶手套的医院里,这种干预措施有何潜在价值。(是的,的确有一些乳胶导管,但手套才是乳胶的主要来源。)没有人问过这件事是否值得费那么大劲儿。
这种对待过敏的方式,展示了清单是如何反受其害的。一旦你开始对一切事物做逐项检查,就会陷入清单过载之中。中心管和外科手术清单运作良好的其中一个原因是,它们是医院大楼里仅有的清单。一旦你使用的清单达到数十个,医生护士就应付不过来了。需要核对的事项是如此之多,你几乎无法照护病人。这种情况下,每个人就只是把所有事项都勾掉,让一切项目消失。这不一定是系统的蓄意博弈。这是一种生存机制。
从这些减少医疗过失和改善患者安全的最初尝试中,我们可以吸取一些教训。一个是,在考虑问题时必须把系统看成一个整体,东一榔头西一棒子的努力只能让你止步于此。另一个是,如果过分强调“100%合规”,你到头来肯定会遇到那些钻系统空子的人,即便他们那样做时并非心怀恶意。但事实上,最关键的教训是,如果你不关注人类行为,不关注我们普通人如何交流,系统如何运作,以及至关重要的实施情况的话,即便是最好的解决方案也注定会失败。当然,如果我们中有任何人读过历史书的话,我们早就知道这一点了。
1846年的夏天,一位年轻的匈牙利医生伊格纳兹·塞麦尔维斯受到委派,在维也纳综合医院担任相当于产科部的住院总医师一职。该医院有两个产科病房,用一般的实用医学术语来说,分别叫作第一产科(First Clinic)和第二产科(Second Clinic)。这两个产科提供免费医疗服务,因而维也纳的穷人来这里分娩。这桩交易的另一面是,这些产妇是教学服务的组成部分,她们由受到更资深的工作人员监督的实习生照顾。第一产科是医学生的培训基地,第二产科是助产士的培训基地。
为简化日程安排,这两个产科交替安排收诊日。然而,塞麦尔维斯医生很快了解到,产妇非常喜欢第二产科,为了被第二产科而不是第一产科接收,她们几乎愿意做任何事。第一产科名声在外:去那个地方,就是去送死。
但第一产科这么不受人欢迎并非只是因为声誉——有数据可以证明这一点。当时,产后发热盛行,是当时健康母亲的致命杀手。第一产科的死亡率远远高于第二产科,有时甚至高出十倍。产妇们苦苦哀求,痛哭流涕,恳求获准进入第二诊所。有传言说,一些妇女选择在街上分娩,而不是去第一产科碰运气。
作为住院总医师,塞麦尔维斯决定找出死亡率迥然不同的原因。因为两个产科病房轮流接收病人,所以产妇是随机分配的,至少理论上如此。然而,事实上,第二产科安置了更多产妇,因为妇女们想尽办法被这里收治。即便工作量增加,第二产科的死亡率仍然较低。塞麦尔维斯检查了他能想到的每一个可能解释这两个产科之间死亡率差异的特征,包括母乳喂养率、宗教仪式、通风和天气。除了一个由医学生任职,另一个由助产学学生任职这一明摆着的事实,他最终也没发现这两个产科之间有何不同。
助产士与医生的做法有何不同?结果发现,相差无几,至少他们在产科病房里照顾病人的方式没什么不同。分娩技术是一样的。不同的是他们在去产房途中所做的事情。医学生早上要做尸体解剖,助产士不做。
对塞麦尔维斯而言,起决定性作用的是他的一位同事不幸去世了。这位内科医生在一次尸检中被一名医学生挥舞的手术刀(居然)刺伤后病倒,不久之后就去世了。塞麦尔维斯参与了对同事的尸检,他注意到其病理特征与死于产后发热的妇女的相同。
虽然疾病的病原菌学说当时尚未被普遍接受,而且塞麦尔维斯也不可能知道是链球菌在做手脚,但他得出结论说,某种“尸体粒子”经由医学生的手从解剖室转移到了产房里。1847年5月,塞麦尔维斯吩咐他的学生在进入产房前用石碳酸洗手。第一产科的死亡率立马降至与第二产科同一水平。
在医学编年史中,这一事件被认为是第一次成功的患者安全干预。塞麦尔维斯评估了这一问题,实施了变革,并评估了结果。它有可能拯救了不计其数的生命。然而,塞麦尔维斯的这个故事是一个关于实施的警示。你可能拥有世界上最好的患者安全干预措施,可以说塞麦尔维斯就是这样,但如果你没有很好地实施的话,就彻底无望了。
就像任何打破既定秩序的人可能遭遇的那样,塞麦尔维斯面临来自医疗机构的抵制。对这名来自匈牙利的移居者(竟然还是个犹太人)所暗示的事情——他们敬重的医疗服务实际上导致了病人的死亡,维也纳的资深医生心生愤懑。改变既定的惯性思维近乎奢望,但如果你想要做出任何改变,这就是一项必要的任务。这需要在劝说、说服、鼓励和施压之间找到最佳击球点。塞麦尔维斯显然不具备上述任何技能。
首先,他十多年来都没有发表他的研究结果,因此其他医生没法检查他的数据。他执意要他们相信他的话,这让他们更加恼火。大家都说,塞麦尔维斯粗鲁而傲慢。他以为批评是冲着他来的,用公然威逼和辱骂回应同事的质疑。他在给一位医生的信中写道:“教授先生[22],你是这场大屠杀的盟友。”[23]
除了这种人身攻击,还有系统问题——如果医生在检查病人前必须洗手,那么就必须在各处设置盥洗盆。医院的管道系统必须彻底重新设计,这是个不那么容易克服的难关。在塞麦尔维斯开始实验的大约15年后,他终于出版了一本关于产后发热的书。这本书在医学界反响平平,因为当时的医学界仍然确信,产后发热是由空气中有害的“瘴气”引起的。最终,医学权威嘲笑并无视了塞麦尔维斯及其主张。
此后,塞麦尔维斯的精神状况迅速恶化。目前尚不清楚他是否患有阿尔茨海默病、双相情感障碍或神经性梅毒,但毫无疑问,他的病情因压力过大(以及过度饮酒)而恶化。在他生命的最后四年中,他猛烈抨击医学权威,向同事发送充满愤怒和侮辱的信件。1865年,他被送进精神病院,两周内就去世了。
最具讽刺意味也最令人痛苦的是,尽管塞麦尔维斯来到精神病院时在生病,但几乎可以肯定,他所得到的医疗护理加速了他的死亡。当他试图逃离精神病院时,他遭到门卫的毒打,被穿上拘束衣隔离起来。当时,精神疾病标准的治疗方式包括冰浴、催吐、暴晒和放血。有人说,殴打令他的手受伤,伤口在精神病院恶劣的条件下感染,形成坏疽。塞麦尔维斯很可能死于脓毒症,和他在维也纳第一产科里的产妇一样。
在涉及患者安全工程时,塞麦尔维斯事件是一例能够说明实施的至关重要性的个案研究。但我们还可以从中吸取其他教训,其中最重要的是要关注护士的工作。就在第一产科通过效仿助产士,享受其最初几年的低死亡率时,年轻的弗洛伦斯·南丁格尔正在拜访欧洲各地的医院,写下关于医院(多半是可怕的)条件的愤怒笔记。她注意到,许多医疗方案(包括砷、汞以及大肆放血)造成的伤害大于好处。与塞麦尔维斯一样,她很快了解到,医生不愿听到他们反复打磨的治疗方案是错误的、有害的,或两者兼而有之。
克里米亚战争期间,南丁格尔在奥斯曼帝国斯库台地区的英国陆军医院工作,她对那里糟糕的条件感到震惊。病死的士兵数量至少是战死的四倍——正是凭借南丁格尔一丝不苟的记录,这些数字才被披露。她为卫生(包括洗手)、伤口护理、食物准备、医疗用品和病人分流制定了严格的标准。1855这一年,医院的死亡率急剧下降,从33%降到了2%。
在她1863年出版的《医院笔记》一书中,她以一种颇具现代风格的精辟讽刺写道:“把医院的首要要求阐述为‘不伤害病人’,似乎是奇怪的原则。然而,制定这一原则是很有必要的。”南丁格尔的书比医学研究院的《犯错乃人之常情》早了136年,但它们希望传达的主旨是类似的:医疗护理事实上可能会给患者带来风险,为了改善整体的健康安全,人们必须把注意力集中在修正医疗系统上。南丁格尔在实施方案上比塞麦尔维斯高明了一点:她亲手将自己的一本书交给了维多利亚女王。正如当今患者安全倡导者会告诉你的那样,直接去找高级领导总会奏效。
当然,也有来自一些医学权威的抵制。南丁格尔的经历与一个半世纪后彼得·普洛诺福斯特在导管相关感染方面的经历惊人地相似:医学界难以接受这些不良结果是可以预防的这一想法。正如当时普遍认为与导管相关的感染是不可避免的一样,军事医院里的死亡也被认为是战争的基本组成部分。南丁格尔愤怒又无奈地指出,“卫生学的合理原则绝对没有广为人知”,因为人们继续相信“接触传染是不可避免的死因”。[24]我们护理病人的方式会造成伤害这一想法对19世纪50年代的医学权威而言是具威胁性的,而对21世纪初的医学权威而言,情况依然如此。
南丁格尔也证明了普洛诺福斯特不得不论证的观点,即你必须衡量正在发生的事情,才能知道你在何处、如何以及能否取得进步,证明的同时她也遇到了同样大的阻力。对南丁格尔坚持做详细记录的做法,军方官僚机构怒不可遏,但她还是坚持了下来。许多人认为,她为当今的感染控制奠定了基础。
令人啼笑皆非的是,在南丁格尔用以改善患者护理情况的方案中,已包含了普洛诺福斯特清单中的所有五个步骤。在她使用“干净”(clean)一词的地方,他用的是“无菌”(sterile),但除此之外,她制定的规定与他的基本相同——洗手,清洁病人的皮肤,为病人使用干净的覆盖物,医务人员穿干净的衣服,用干净的敷料覆盖伤口。
从严密的文件记录、严谨的临床技术到对系统改进和实施的关注,怪不得普洛诺福斯特如此确信,需要增加护士的自主权,以应对患者安全问题。普洛诺福斯特向我描述,在职业生涯伊始自己是多么开明。“我要做个有团队合作意识的人,我会向护士征求意见。”那时的他这么对自己说,为自己这种先进的态度感到自豪。可以说,他是做了,但实际上只是嘴上功夫。事实上,他没有好好听护士们要说的话。随着他越来越沉浸在患者安全文化中,他遂决定请护士加入医生,一起查房,这样一来,就可以强调说医疗护理是团队合作。但重症监护室是个繁忙的地方,经常很难协调时间。如果在查房时护士没有时间,又没有必要推迟所有事情,这种时候他就会不带护士,继续查房。
“现在,”他告诉我,“如果护士没空,我根本不会查房。”
他意识到,合作不只是政治正确的时髦话,合作实际上是患者安全最重要的支柱之一。来自不同学科、不同层级的工作人员需要能够一起工作,敞开对话。他们必须能指出问题和错误,而无须担心受到斥责或轻视。如果一个机构要真正认识到医学的高风险性质,并致力于改善患者安全,它就必须创造出一个鼓励真正合作的环境。这需要资源投入——你需要有充足的时间、空间和员工(那些勉强度日、超负荷运转的员工没有合作的心力)。还需要态度上的承诺——由高层树立榜样,鼓励批评,不容忍替罪羊现象,等级制度和自尊心不会主宰一切。
患者安全与避免医疗过失是一个混杂诸种事项的复杂问题,涉及医疗专业人士之间如何互动和沟通,他们如何与患者及其家属互动和沟通,以及最先进的医疗系统如何放任细枝末节被忽视。人类心理学在医疗保健的成功(或失败)中所发挥的作用与最先进的技术同等重要。此外,在塞麦尔维斯、南丁格尔和普洛诺福斯特的故事中也贯穿了一条线索:关注护士。这一点在杰伊的故事中得到了有力体现。