第一节 中医临床实践指南的定义与发展
一、中医临床实践指南的定义
临床实践指南(clinical practice guidelines,CPGs)是针对特定临床情况系统制定的、帮助临床医师和患者做出恰当处理的指导性意见(推荐建议)。根据美国医学科学院(Institute of Medicine)的最新定义,临床实践指南是指基于对证据的系统评价及可选择的医疗措施利弊权衡的评估之后,由对患者的最佳医疗推荐形成的声明性文件。中医学作为保留完整的具有系统理论和传承的传统医学体系,具有悠久的疾病防治历史和广泛的临床应用。中医临床实践指南是指针对中医或中西医结合的诊疗措施,采用循证医学的方法,系统地收集、整理和评价干预措施利弊的临床研究证据,结合专家长期的实践经验,为疾病的诊疗而制定的声明性文件。遵循临床实践指南能够降低临床实践中的不一致水平,减少不同医疗机构和不同临床医师间医疗水平的差异,避免不必要的诊断性试验,减少无效治疗手段的使用,从而为患者提供最经济、有效的治疗,是规范临床行为的重要举措。
临床实践指南主要分为基于专家共识指南(consensus based guideline)和循证临床实践指南(evidence-based clinical practice guidelines,E-CPGs)。基于专家共识指南受专家个人经验和主观判断的影响较大,还可能受到具有强势话语权专家的主导,因此或多或少会影响指南制定的科学性。随着循证医学的提出和发展,采用循证的方法制定指南已经成为国际上临床实践指南制定的主流趋势与共识。循证临床实践指南是在广泛收集临床证据的基础上,按照循证医学的方法开发出的一组临床实践指导意见。与传统的CPGs不同,循证指南是建立在证据的基础之上,对诊疗的推荐意见均有证据支持,结合相关的专业知识以确保制定的指南具有针对性,因此也就更具科学性和权威性。
循证临床实践指南不同于原始研究证据、系统综述或Meta分析。原始研究证据、系统综述或Meta分析是客观地展示临床研究综合性的结果,并对研究结果进行分析解释,为临床决策提供参考依据。循证临床实践指南则是针对具体临床问题,分析评价最新研究证据后提出的具体推荐意见,以指导临床医师的医疗行为,是弥合最新研究证据和临床实践之间差距的桥梁。指南主要包括两方面内容:一是证据的综合和概括,对证据进行分级;二是针对如何将证据应用于具体病症,提出诊疗建议,并注明建议的级别,让读者使用时可以了解建议的可靠性。
二、制定循证临床实践指南的意义
在循证医学背景下的临床实践指南的产生具有以下重要意义:①有助于规范医疗行为,促进最佳临床实践的使用,减少医疗措施误用或使用不足的问题。②避免医疗机构之间或医生之间由于缺乏充分的医疗信息或专业技能存在差异而造成的医疗干预措施变异太大的情况发生,提高医疗机构的医疗质量,使患者得到合理的治疗。③可以作为解决医疗纠纷的依据,减少医患矛盾的发生。④指南中提供的医疗决策信息集中了最新最佳的临床科学研究和专家意见,使临床医生不用花费大量的时间阅读外文文献就可以得到某疾病最新最权威的指导,节省了临床医生的时间。⑤部分临床指南的形成经过了卫生经济学分析,该指南提供的诊断、治疗意见有助于减少医疗费用,使卫生资源的使用更加合理。⑥可以作为转化医学的重要环节,连接证据与医疗实践。
三、循证临床实践指南制定的步骤
循证临床指南的制定有严格的程序和方法,以保证其推荐意见有科学客观的证据支持。主要制定步骤包括:①提出正确的临床问题;②成立专门的指南制定小组;③系统、全面地检索证据;④使用正确的方法对证据进行严格的质量评价;⑤对证据进行综合,根据证据的级别和强度提出推荐意见;⑥对指南进行同行评价和修改;⑦在临床实践中使用并传播循证临床实践指南;⑧根据临床研究的进展及新证据的出现不断对指南中的内容进行定期的评价和更新。
(一)提出正确的临床问题
指南所覆盖的临床问题范围应明确,如果问题范围太宽泛,有可能导致指南制定过程失控。以评价某干预措施治疗某疾病疗效为例,可以考虑从研究对象(participants,患者或某一具体病症)、干预措施(interventions,所施加的干预措施)、对照措施(comparisons,相比较的干预措施)和结局指标(outcomes,有关的临床结局),即PICO四个方面,将临床问题转化成研究可以回答的结构化的问题。如在现有治疗中加入ACE抑制剂(干预措施),与现有治疗(对照措施)比较,是否可以降低患心脏病的成年人(研究对象)的病死率(结局指标)。如果制定某疾病诊断方法的临床实践指南,所提出的临床问题还要包括对该疾病诊断的“金标准”、可供应用的诊断措施,以及各自的灵敏度、特异度和准确度等指标。另外,指南要对研究对象的相关情况进行描述,如年龄、性别、病情程度或疾病分期等,以明确指南应用的目标人群。总之,提出正确的临床问题是确定指南范围的前提,也直接关系着其后文献检索策略的制定,将影响和指导整个指南的编写过程。提出的临床问题不应该仅站在临床医生的角度考虑,还应顾及其他方的关切,如患者关心的结局、医疗付费方关心的问题等,应多方共同商议制定。
(二)成立专门的指南制定小组
指南的制定应由一个多学科的团队共同完成,由多学科多领域专家和各方利益代表组成小组,除了卫生保健领域的人员外,还应邀请与该临床指南利益相关的其他代表参加,如患者、医疗付费方的人员等。小组成员的构成应满足以下要求:①全部相关的专科、专业组都有代表,能解决所涉及的医疗保健服务的各个阶段的问题;②全部有关的科学证据能被检索出来,并进行严格评价;③应用指南时有可能遇见的临床问题都能识别出来并加以处理;④指南的利益相关者代表能看到该指南是值得信赖的,愿意配合指南的实施。
(三)全面系统地检索文献,并对文献进行筛选
根据提出的临床问题,制定检索策略和文献的纳入排除标准。循证指南应以最新最佳证据为基础,所以指南应收集所有最新的有关证据(过去12个月内),确保推荐意见为当前最佳。当然,中医药的指南有其特殊性,有的治疗措施可能会回溯到查找古代经典著作,现代文献的查找范围也可能会根据需要适当调整。文献通常采用计算机检索与手工检索相结合的方式。由于生物医学文献数量庞大,单个资源(库)难以提供足够全面的证据,单一的检索策略也不适合检索范围广泛的证据资源。指南应提供检索策略的细节,包括关键检索词的选用、检索的时间跨度和所使用的数据库资源。国内文献的检索多使用中国生物医学文献服务系统(SinoMed)、中国知网(CNKI)、万方等数据库,国外文献检索常用的数据库选择顺序为Medline生物医药文献数据库、Cochrane图书馆、循证医学评论数据库(Evidence Based Medicine Review,EBMR)、评价与传播中心数据库(Centre for Reviews and Dissemination Database,CRDD)、临床实践指南Guideline数据库及医学期刊等,一般多是几个数据库联合检索。可用主题词、关键词、期刊名、作者名等作为检索词进行检索。手工检索书本式检索工具,尽可能多地阅读相关医学杂志、研究生论文、会议论文集和内部刊物等,逐期翻阅,然后复印检出文章的原文,并醒目标出归类的关键词或在首页上加上必要的注释。文献检索要反复进行,首先检索已有的指南及系统综述,其次检索随机对照试验,仔细分析每次检索的结果,最后根据所提出的问题和获得证据的数量再扩大检索范围至其他类型的临床研究。
检索完成后,应由专人对文献进行筛选。文献的筛选应分为三步进行:①初筛:根据检索出的文章的题目、摘要等排除明显不符合临床问题要求的文献,那些根据题目和摘要不能肯定的文献要通读全文进行筛选;②阅读全文:对可能合格的文献,应获取全文,逐一阅读和分析,以确定是否合格;③与原作者联系:如果文章中的信息不全面或不能确定,或者有疑问和分歧,应与文章作者联系,获取相关信息,再决定取舍。为了避免偏倚,应该由至少两名研究人员对文献进行筛选,并明确记录检索及筛选的过程及结果,如有意见不一致的地方,应明确说明判断意见不一致时的处理方法。
(四)对检索结果的评价
对纳入研究进行正确的质量评价是保证循证临床实践指南得出正确结论的关键。为了避免在评价文献质量时产生偏倚,可以考虑一篇文章由多人评价,也可采用专业与非专业人员相结合的方法来共同选择和评价,对选择和评价存在意见分歧的文献可通过共同讨论或请第三方讨论解决。
评价文献质量和偏倚风险的方法较多,相关机构也开发了很多实用的量表或清单。在对文献进行具体的评价时,随机对照试验类文献质量可以参考Cochrane协作组的偏倚风险评估工具(risk of bias,RoB)进行评价,该量表包含6个评价条目:①随机方法是否恰当;②是否做到分配隐藏;③是否采用盲法;④是否对退出或失访进行报告,包括失访人数和原因,以及是否采用了意向治疗分析;⑤是否存在选择性结局报告;⑥是否有其他偏倚来源。根据研究对以上条目的满足程度,可以把研究分为低偏倚风险、偏倚风险不确定和高偏倚风险。
非随机对照试验文献质量可以参考刘建平提出的NRS质量评价清单,该清单包括:①是否详细描述分组方法;②是否采用盲法;③是否将所有病例纳入分析;④研究基线是否可比;⑤诊断标准是否明确;⑥混杂因素的控制是否恰当。每个条目满分为2分,可根据文献的具体评价结果对每个条目给予0分、1分或2分。
队列研究和病例对照研究的报告质量可以参考纽卡斯尔-渥太华量表(Newcastle-Ottawa scale,NOS)方法评价。NOS包括研究对象选择4个条目(4分),组间可比性1个条目(2分)和结果测量3个条目(3分),共计9分。
由于系统综述也是一种回顾性、观察性研究和评价,可能存在系统偏倚和随机误差,因此对检索到的系统综述,也需要对其质量进行评价。对系统综述的质量评价可以采用AMSTAR(a measurement tool to access reviews)方法,该清单共包括11个条目。
(五)对证据进行综合,根据证据的级别和强度提出推荐意见
根据文献的评价方法评价文献的质量后,指南制定小组需要根据质量评价结果总结证据的级别和强度,并形成推荐意见。
目前,国际上有多种证据分级标准,其中被广泛接受和使用的证据等级划分标准是GRADE工作组制定的推荐分级的评价、制定与评估(grading of recommendations,assessment,development and evaluations;GRADE)标准,即GRADE标准。该标准已被包括WHO和Cochrane协作组在内的多个国际组织、指南制定机构和协会采用。GRADE把随机对照试验初步列为高质量证据,观察性研究列为低质量证据。但是研究设计和实施的局限性、效应估计值不精确(宽可信区间)、研究结果不一致、间接证据或发表偏倚都可能导致随机对照试验证据质量降级。相反,如果观察性研究的结果非常显著且其设计和实施过程没有明显偏倚,也可以使其证据质量升级。GRADE标准根据研究设计方法学将证据质量分为4级:①高级证据:随机对照试验或质量升高两级的观察性研究;②中级证据:质量降低一级的随机对照试验或质量升高一级的观察性研究;③低级证据:质量降低两级的随机对照试验或观察性研究;④极低级证据:质量降低三级的随机对照试验或质量降低一级的观察性研究,或病例系列、病例报告。
鉴于中医药的特点和其独特的理论体系,本团队曾针对中医药证据体的构成提出了中医证据分级标准的建议(表1-1)。
表1-1 中医药临床研究证据的分级标准
注:N-of-1试验,单病例随机对照试验;规范化的专家共识,指通过正式共识方法(如德尔菲法、名义群体法、专家共识会议法及改良德尔菲法等),总结专家意见制定的,为临床决策提供依据的文件;非规范化的专家共识,指早期应用非正式共识方法如集体讨论、会议等所总结的专家经验性文件。
指南制定小组评价并总结证据后,则考虑从整体证据中得出哪些结论,基于结论提出哪些建议。在循证指南中的推荐建议应该是来源于研究的证据,对证据进行质量评价后根据证据级别,并结合目标人群文化背景、风俗、法律等因素综合推荐并决定其推荐强度。形成推荐意见时应注意推荐意见不是证据等级的直接演绎,即高级别的证据不一定都推荐或强推荐。临床实践指南的核心是指导临床实践决策,然而很多临床问题目前仍缺乏相应的高质量的临床研究证据,或因各种原因缺乏高论证强度设计的临床研究。因此确定推荐建议时,一方面应重视研究证据的级别,另一方面应权衡利弊,在综合其他因素的基础上,最后形成推荐建议。当证据明确显示干预措施利大于弊时为强推荐,当弊大于利时为强不推荐或禁止使用;当证据显示利弊不确定或无论质量高低的研究证据均显示利弊相当时则可为弱推荐或弱不推荐。循证临床实践指南的制定过程就是证据到推荐建议的形成过程,强推荐建议通常根据最有力的证据提出,论据的强度最高,对临床决策的指导作用最大;而弱推荐建议所依据的证据可靠性较低,临床医生可结合自己的经验来判断执行;当证据不充分时,也可以对干预措施不作推荐。
(六)指南的修改和同行评价
为了确保指南的质量,指南在发表前必须进行修改和外部评价。指南在完成初稿和定稿后,首先要进行同行评议,通过判断推荐意见的合理性和可应用性对指南的有效性提出改进建议。同行评议可以通过会议、邮件等多种方式进行,在充分获得同行、权威机构或专家的评审意见后,指南制定小组进行集体讨论并对意见达成共识,再对指南进行修改。
(七)使用并传播指南,收集反馈意见
指南发表后,应积极收集循证指南在临床实践应用中的反馈意见,以指导指南的修订。收集的内容包括:证据应用于临床决策后对患者诊疗效果的影响、应用证据后对医疗费用(成本)的影响、应用证据后对医疗质量促进的影响,以及应用证据后对临床研究水平的影响等。
(八)对指南进行定期评价和更新
指南基于的是最新证据,随着临床研究的进展和新证据的不断出现,指南也必须进行定期评价与更新,及时将新知识整合进去。指南的更新频次一般为3年左右,最长不超过5年。比如2005年美国心脏协会(American Heart Association,AHA)制定的国际心肺复苏指南,是在2000年国际心肺复苏指南的基础上,应用循证医学证据,结合专家共识而形成的,使其具有更强的可操作性和现实意义。
总之,循证临床实践指南的制定是一个复杂的过程,每一步骤都应该严格按照循证方法来执行,这是确保临床实践指南质量的关键。