第3章 荟萃分析介绍
荟萃分析方法是产生高质量循证医学证据的重要方法之一。什么是荟萃分析?荟萃分析能解决什么问题?这是临床医师常常询问的问题。“荟萃”一词源于希腊文,意为“more comprehensive”,即“更广泛、更全面”。荟萃分析是现代临床研究中一种新的研究方法,即用统计合并的方法对具有相同研究目的、多个独立的研究结果进行比较和综合分析的一种研究方法。荟萃分析于20世纪70年代开始出现于卫生健康领域。80年代关于荟萃分析的研究报告开始增多,并逐渐应用到临床医学的各个领域。90年代初,国内学者开始利用荟萃分析方法开展疾病的诊断、治疗、干预及决策等临床各领域的研究。
一、荟萃分析的定义
荟萃分析的英文原文是meta-analysis,国内有学者将它译为“荟萃分析”、“综合分析”,也有人翻译为“分析的分析”、“资料的再分析”等。在英文文献中,荟萃分析还有一些其他表达方式,如over view、pooling、data pooling、quantitative review、quantitative synthesis、liter-ature synthesis、literature extraction等,这些表达方式都表达了一个概念,即对以往的研究结果进行系统的定量的分析。Glass把荟萃分析定义为“以综合现有的发现为目的,对单个研究结果的集合进行统计分析的方法”。我们对荟萃分析暂且做如下的解释:对具有共同研究目的且相互独立的多个研究结果给予定量分析、合并分析,剖析研究间差异特征,综合评价研究结果。
二、荟萃分析解决的问题
1. 增大统计功效 单个研究报告多数所含样本量较小,所以有时尽管结果有临床意义,却无统计学意义,但是如果把相似的研究例数相加,样本量扩大,可能就会得出另外的结论。在临床研究中,如果样本量小,则结果受偶然因素的影响就大,且难以明确肯定或排除某些相对较弱的药物作用,而这些作用对临床来说可能又是重要的。如果要从统计学上来肯定或排除这些作用,研究所需要的样本量可能较大。荟萃分析通过整合大量的临床研究报告,增加了样本量,增加了结论的统计功效。
2. 解决临床分歧意见 临床医学领域中,关于某一问题经常有许多学者进行研究,在医学期刊中对某一问题同样会有多篇报道。由于研究结果具有偶然性,且每个研究者所开展的具体研究可能会因局部样本等问题,使每个研究者的研究结果不一致,甚至相反。从单个研究结果来看,经常很难对研究结果下一个确切的结论,不同作者对同一问题可能持相反的处理意见。利用荟萃分析进行合并整合后,可得出对该问题的全面的认识,解决专家间意见不一致的问题。
目前国际上Cochrane协作网及我国EBM中心所进行的主要工作,就是把某一专题的临床研究报告集中起来作荟萃分析,并将结果定期发布,为临床决策提供依据。
3. 增强疗效的可靠性和客观性 经荟萃分析后证明对成千上万例患者都有效,当然要比几十例报告更有说服力。此外,荟萃分析是利用数理统计的方法对若干临床研究的数据进行整合,这与综述的主观性综合评价不同。一般文献综述的缺点是,综述的作者总是或多或少地喜欢选择引用那些支持他们观点的文献。荟萃分析作为一种定量的文献分析方法,则是综合所有相关的研究方法和可靠的临床研究结果,试图得出没有偏倚的结论。这些相关研究,必须具备药理学或临床治疗上的组间可比性,所以荟萃分析的结果比综述的结论更客观、更全面。
4. 引出新见解 荟萃分析有时会出现一些临床研究者事先想不到的结果,例如发现中青年女性用药物降血压对健康不一定有利,就是从几种降压药远期疗效的荟萃分析亚组中得出的结论。
三、荟萃分析的研究步骤及研究方法
荟萃分析的基本步骤:①确定荟萃分析的研究目的,确定单个研究报告的入选标准、文献检索方法、所要采取的统计分析方法等;②查找文献,荟萃分析所要求的研究报告不仅是发表在期刊杂志上的临床论文,除了在现有的数据库中进行计算机检索以外,还需向该研究领域的专家咨询,以获取哪些方法可靠但未被发表的论文;③按事先确定的统计学方法对各个单个研究结果进行综合分析;④对荟萃分析得出的结论必须经灵敏度分析,以明确因果关系的强度;⑤总结成文。
荟萃分析的统计学分析计算步骤:
(1)对多个独立研究的统计量进行同质性检验;
(2)对具有一致性的统计量进行综合加权,计算出合并后的平均统计量;
(3)对综合估计出的统计量进行统计检验和统计判断;
(4)计算某些统计指标的95%可信限。计数资料的统计分析方法常采用固定效应模型和随机效应模型;计量资料通常采用合并检验及效应测量。
四、荟萃分析的缺陷和不足
近年来,国内外有关荟萃分析的论文数量增长较快,国内有关荟萃分析的应用也日渐增多。许多临床科研工作者在利用荟萃分析进行研究时,或阅读有关荟萃分析的文献时,往往忽视了荟萃分析的一些方法学条件,不了解荟萃分析适用范围,不加分析地去接受荟萃分析结论,因而导致荟萃分析这种统计方法在临床科研应用中有泛滥趋势。
1. 方法自身的缺陷 荟萃分析最致命的缺陷在于它是观察,而不是具体临床研究。一项具体的临床研究可以把各种条件人为地去控制,特别是实验研究,可以在各种控制好的条件下,把一种现象暴露出来,结果比较可信。但荟萃分析则不然,它是把已有的研究报告被动地接受下来,这些论文可能好坏都有,有的数据不完整,有的混杂因素可能控制不好,当然也有的数据真实可靠,荟萃分析是把这些结果全部接受下来。另外,荟萃分析还有可能对一些有争议的课题过早地做出定论,从而抑制了对有争论课题的进一步深入研究。
2. 出版偏倚(publication bias) 荟萃分析所选取的原始研究报告在很大程度上存在着出版偏倚,而这种偏倚有时在做具体的荟萃分析时很难避免。作者往往只把阳性结果的试验拿来写论文,编辑部也往往注重发表阳性结果的论文。荟萃分析在收集数据时,除了要对已发表的论文数据库进行系统检索,还要想方设法尽可能收全那些未发表的相关研究。但目前,世界上多数医学数据库检索都是以收集已发表论文为主,对那些未发表的研究论文及会议论文等,要想收集全并非易事。特别是在我国,目前所开展的多数荟萃分析并没有收集那些未发表的论文(多数是受条件所限),所以出版偏倚不可避免地存在并影响荟萃分析的结论。
3. 原始研究报告的质量 原始研究论文的质量直接影响荟萃分析结论的正确性。目前,我国临床科研整体水平还不高,大量临床科研论文都存在着方法学的缺陷,如果荟萃分析所取的原始资料以这部分不可靠的论文为主,那么可想而知,荟萃分析的结论也同样是不可信的。因此,在进行荟萃分析时,一定要对原始研究报告进行严格的方法学评价。Cochrane协作网所生产出来的荟萃分析之所以能引起EBM专家的重视,也正是因为它有严格的方法学评价。目前我国医学期刊论文可供作荟萃分析的合格的论文并不多,所以对中文文献进行荟萃分析时一定要注意这一点。
五、荟萃分析的评价原则
近年来,有关荟萃分析的研究虽然在不断增多,但不是所有的荟萃分析都是可靠的。如同其他研究一样,方法学的正确与否严重影响着结果,甚至导致错误的结论。评价荟萃分析的结论是否客观、公正、可靠,可从以下几个方面考虑:①是否事先有研究方案;②是否清楚地报告了临床试验的收集策略;③是否有专门的纳入和排除标准,是否列出了被纳入或排除的有关试验的论文,并说明了排除的理由;④是否有直观的图示和一致性检验;⑤是否使用恰当的统计学处理和灵敏性分析;⑥如果综合分析显示显著性差异,是否陈述了出版偏倚的问题;⑦是否做出了有效、不肯定或有害的结论,或提出了是否需要进一步研究的建议。
总之,荟萃分析在医学领域中仍处于初级阶段,其定义、应用及方法还有待于进一步发展,广大读者对荟萃分析不能过分迷信,其质量的高低仍依赖于自身方法学的完善及所入选的单个试验的质量。但是,我们必须看到,荟萃分析是一种科学的、严谨的、系统的方法,不是猜测,可用于临床决策、医院和社会卫生政策、卫生项目评估、干预措施的成本效益分析等领域。