上QQ阅读APP看书,第一时间看更新
第五节 质量控制与研究方案的制订
一般来说,流行病学研究的目的不外乎是揭示研究事件的特征及其与研究因素的联系,并对研究因素的效应做出科学的评价。因此每一种流行病学研究均可视为是一种“测量”。流行病学研究设计的目的就是要保证这种“测量”的准确性,以极小的误差来估计测量目标的参数值,使研究结果较好地反映真实情况。在流行病学研究中,无论是观察性研究还是实验性研究,从研究设计、实施、分析至结果解释、推论的整个过程中,研究的准确性可能受到许许多多因素的影响,使研究结果与真实情况存在偏差,有时甚至会得出与实际情况完全相反的结论。造成这种偏差的原因归纳起来有二:一是随机误差(random error);二是系统误差(systematic error),即偏倚。流行病学研究设计的原则与策略,就是如何减少这两类误差,以达到准确的“测量”,减少随机误差以提高测量的精确性(precision),减少偏倚以提高测量的真实性(validity)。
随机误差亦称随机变异,其产生的原因有多种,主要来源于对研究对象的选择过程,即抽样过程。这种随机变异被称为抽样误差或抽样变异。抽样误差不仅发生于现况研究的抽样调查中,在所有的流行病学研究,包括病例对照研究与队列研究都有可能存在抽样误差。增加研究的样本含量是减少抽样误差、提高研究精确性的最基本的方法。另外,提高研究信息获取的效率及研究效率,如样本构成的考虑、保证分层研究的效率等,也是提高研究精确性的主要途径。
系统误差又称为偏倚(bias),理论上是可以避免的,因此在设计阶段有必要了解在研究过程中可能产生的各类偏倚并加以预防和控制,以提高研究的真实性。偏倚主要分为选择偏倚(selection bias)、信息偏倚(information bias)和混杂偏倚(confounding bias)三类。下面重点介绍各类常见偏倚及其控制方法。
一、选择偏倚及其控制
选择偏倚是指被选入到研究中的研究对象,与没有被选入者特征上的差异所导致的系统误差。此种偏倚在确定研究样本,选择比较组时容易产生,也可产生于资料收集过程中的失访和无应答等。选择偏倚在各个研究类型中均可发生,以在病例对照研究和现况研究中最为常见。
选择偏倚的控制方法有如下几种。
(一)掌握发生环节
不论采用何种研究方法,研究者要对研究过程中可能产生选择偏倚的环节事先有充分的了解,如所研究疾病的某些症状或诊断是否与某些因素有关?研究的暴露是否可使无症状病例得以检测?研究对象可能无应答的原因与比例等。以便能在设计时采取相应的措施防止和减少此类偏倚的发生。
(二)严格选择标准
研究对象的纳入与排除需有严格、明确的标准,以使其能较好地代表总体。
(三)减少无应答率
在实际操作过程中,要注意取得研究对象的配合,以减少无应答率。
(四)采用多种对照
采用一种以上的对照与观察人群比较、分析。例如,在进行以医院为基础的病例对照研究时,对象的选择极易产生偏倚,此时可以选择两个或两个以上的对照组,如不同病种对照,其中之一最好选自一般人群。如此通过比较不同对照组的结果,可以对存在的选择偏倚及研究结果的真实性予以评价。
二、信息偏倚及其控制
信息偏倚又称为观察偏倚,是指在研究资料收集、编码和分析过程中出现的系统误差。信息偏倚可来自于研究者、参加对象和检测工具。研究者本身可由于不恰当的观察或访问、偏倚性随访、错误的资料编码以及结果的解释与发表等原因而产生信息偏倚。参与对象的信息偏倚包括回忆偏倚和报告偏倚等。此外,测量工具的不准确亦可引起信息偏倚。
完全避免信息偏倚是不可能的。可以这样说,流行病学研究中所测定的每一个变量只是该变量在人群中真实情况的估计值,如饮酒、吸烟,以及某种维生素平均日摄入量等。然而,我们所关心的不仅是这些变量的资料有多么准确和详细,更关心这些资料的准确性和详细程度在各比较组间是否均衡。控制信息偏倚的方法主要有如下几种。
(一)校准测量工具
评价或验证调查问卷的效度、仪器的准确度和精确度是否符合测量要求。对于准确度低的测量工具要进行校正或选用其他效度好的测量工具。
(二)统一资料收集方法和人群分类标准
要对调查员进行统一严格的培训,能正确理解和表达调查表的含义,采用统一、无偏和客观的态度调查。各比较组中所有研究对象采用相同的调查工具、相同的调查方法、相同的人员调查。暴露、结局和混杂变量应有统一的、明确的定义、分类或诊断标准。对收集的资料及时进行复核,最大限度地保证资料的真实性。
(三)盲法
盲法(blind method)即在资料收集和处理过程中,对研究者及被研究者掩盖暴露或疾病的身份,或研究假说的内容。例如在前瞻性研究中,当确定研究人群的疾病状态时,研究者不知道被研究者的暴露状态,在病例对照研究中,当确定被研究者的暴露状态时研究者不知道被研究者是病例还是对照。在研究者评价实验研究的干预效果时,不知道受试者的处理情况等。
(四)尽量收集客观指标的资料
尽可能利用实验方法获得客观资料,减少主观因素的影响。若调查问卷是收集资料的唯一方法时,应尽量使用封闭式的问题。
(五)提高调查技巧
对于敏感问题,可采用随机应答技术、匿名调查等方法提高真实性。为了减少回忆偏倚,尽量设计适当的问题、提供相关模型或图片以帮助研究对象准确回忆,提高对问题含义理解的准确性以降低回忆偏倚。此外,严格的调查设计和研究人员的科学态度可能减少信息偏倚。
三、混杂偏倚及其控制
当研究某暴露因素与疾病之间的关系时,由于某个既与研究的疾病有联系,又与研究的暴露因素有联系的其他因素的影响,掩盖或夸大了所研究的暴露与疾病的联系。这种现象叫混杂(confounding)。产生的偏倚为混杂偏倚,引起混杂偏倚的因素称为混杂因素。混杂是流行病学研究设计关注的一个重点问题。混杂作用可以在任意方向上造成偏差,它可以高估效应,也可以低估效应。有时混杂偏倚的作用可能很强,甚至逆转效应的方向。因此对混杂的控制至关重要。
混杂偏倚可以发生于研究的设计与分析阶段。在研究过程中需要通过科学严谨的设计、合理的统计分析与结果解释来控制混杂因子对研究效度的影响。下面主要介绍在设计阶段中的控制方法:
(一)随机化分组
随机化分组(randomized allocation)简称随机化(randomization),主要用于干预实验研究中的混杂因素控制。在随机对照试验中,研究对象被随机地分配到干预组和对照组。当参加随机分组的样本数量足够大时,随机化分组可以使任何已知和未知的基线混杂因素在干预组和对照组间达到均衡,从而排除基线任何潜在混杂因素对干预效果的影响。
(二)匹配
匹配(matching)是在选择研究对象时,通过限制的手段,使比较组(如病例组与对照组,暴露组与非暴露组,干预组与对照组)间某种或某些特征达到均衡,目的是排除比较时匹配因素对暴露与结局之间联系的干扰。比如,病情轻重和年龄往往是多种疾病治疗效果的重要影响因素,在进行干预研究时,可以将年龄和病情相同或相似的对象通过匹配分配至干预组和对照组,从而消除年龄和病情轻重对治疗效果的影响。
匹配可以应用于观察性和干预性研究。匹配因素只能是混杂因素。人口学特征(如年龄、性别、地域等)、疾病的重要病因(非研究因素)和预后因素(如病病情、病型、病程)常常作为匹配的因素,因为这些因素通常是已知的或潜在的混杂因素。由于一个因素用于匹配之后,就不能再研究它对疾病的作用,也不能研究它与其他因素对疾病的交互作用,因此待研究的因素不能作为匹配因素,暴露及结局变量的任何结局或效应变量均不能作为匹配因素,否则就会低估效应或联系,这种情况称之为匹配过头(over-matching)。
(三)限制
在设计时通过制订研究对象纳入及排除标准来控制某些因素对结果的干扰,如疾病的干预研究,可通过限制(restriction)某特定病型和病情的患者参加,以消除病型和病情对干预效果的干扰。与匹配类似,限制因素也只能是混杂因素。限制虽然在某种程度上提高了研究的内部效度,但亦会减弱研究的外部效度,即研究结果的外推性。由于限制条件越多,研究对象的代表性就会越差,结果外推越困难,因此,在流行病学研究中,相对较少用限制方法来控制混杂因素。
与随机化分组不同,限制与匹配均只能消除已知混杂因素的影响,而不能排除未知混杂因素的干扰。
四、现场流行病学研究方案的制订
(一)研究方案的基本内容
前面我们讨论了流行病学研究设计的关键问题,现在我们需要将解决这些问题的原则与方法应用到具体的课题设计书中,形成研究方案,作为在研究进行过程中各环节的实施与质量控制的依据,以保证能按计划顺利进行。研究方案是整个研究过程所依循的文件,其有关内容应明确、具体和详细。研究方案通常包括以下内容:①研究课题名称;②研究背景;③研究目的;④研究对象;⑤研究方法;⑥研究进度;⑦研究基础;⑧预期成果;⑨质量控制方法;⑩参考文献。
1.研究课题名称
是建立在研究的内容与研究的具体目标之上的对研究内容的高度概括性的总结,通过简练、规范和专业的语言来准确反映研究课题的核心内容。因而标题要简练,表达要规范、标准和准确,语言要专业化和学术化,并能突出研究中具有创新和特色的研究内容,同时要求在课题名称中体现医学研究的三要素,即研究对象、处理因素和效应指标。
2.研究背景
指进行该项研究的动机、意义及相关依据。通常是根据文献复习或以往相关研究工作的结果或经验进行整理,目的是集中介绍该研究的立题依据。内容包括自己以往的研究以及国内、外学者所进行的相关研究现状和趋势。通常对与该研究课题密切相关的研究工作应予详细介绍,如研究的年代,所用的方法,研究结论或已经解决的问题等。哪些问题已经清楚或已有共识,哪些问题尚不明了,尚需验证或尚待进一步解决,以及解决这一(些)问题的意义、价值等。
3.研究目的
是研究课题的核心,因为与研究有关的一切工作都是围绕目的而进行的,如目标人群的确定、研究对象和研究方法的选择等。确定研究目的在遵循第二节中讨论的基本框架的基础上,在这里要给出准确的表述。
4.研究对象的选择
包括研究对象的确定,研究对象的样本含量,研究对象的选择原则、标准、来源,以及选择的方法如抽样、匹配等。
5.研究方法
包括所选用的研究方法类型及研究中所涉及的有关技术或工具等,一般包括以下几点。
(1)研究方法类型:
包括横断面研究、病例对照研究、干预试验,或不同方法类型的交叉设计。
(2)资料收集方法:
包括调查问卷的拟定、调查员培训、观察指标;信息获取方法,如访谈、函访、常规资料的摘录等;以及需测量项目的测量指标、测量方法及标准化等。
(3)数据整理分析方法:
包括数据整理方法,如手工整理、计算机整理;所用的分析软件、数据分析策略及具体分析方法,如多因素分析模型、交互作用分析模型等。
在研究方案中,通常是将上述有关方法整理成一流程图,以使整个研究过程与使用方法一目了然。
6.研究进度
包括研究的总体时间安排,如整个研究工作分几个步骤,每一步骤计划于何时完成,以便对整个研究工作的时间安排心中有数,有利于对整个研究工作的进度控制。通常是按照上述流行病学研究的过程分为几个阶段,将每一阶段的时间进度予以安排,如研究计划制订阶段、研究实施阶段、数据整理分析阶段以及课题总结与论文撰写等。最好是根据各阶段的时间安排编制研究时间进度表。
7.研究基础与预期成果
研究条件包括与完成该项研究有关的人力、物力条件,如课题组成员情况,组织情况,所需仪器设备,相关的研究工作基础以及研究所需经费落实的情况等。研究方案中应说明已具备的条件与尚待解决的条件及拟解决的途径。
预期成果指完成该研究后可以得到的结果或数据,及其理论或应用价值与学术水平的预测,其与研究目的相呼应。
8.质量控制
如前所述,流行病学研究设计的目的是为了提高研究的精确性与真实性,以达到准确的测量。研究的质量控制是贯穿于研究设计、研究实施以及结果分析与总结的各个环节的。在研究过程的各个环节产生误差或偏倚,均可影响研究的精确性与真实性。因此在研究方案中应根据已有知识,分析在每个环节可能产生的误差或偏倚的可能性,充分估计在研究中可能出现的各种问题,制订详细的质量控制对策与措施。在流行病学现场研究中,有许多环节很容易导致误差或偏倚的发生。
(1)研究对象的选择过程:
包括样本大小的估计,抽样方法,研究对象的选择标准、来源、方法等。例如在病例对照研究中,病例与对照选自人群或医院患者,以何种方法选择;在队列研究中,暴露队列与非暴露队列的选择;在实验性研究中,研究对象的划定及分组等。
(2)数据收集过程:
包括调查问卷的设计,获取信息的方式、方法,用于测量的仪器设备,调查员的选择与培训,以及研究对象的配合情况,如应答率,依从性等。
(3)数据整理阶段:
包括数据完整性的核对,对不符合要求数据的处理,数据的量化方法,数据录入人员的技术水平,录入准确性的核对等环节。
(4)数据分析与总结阶段:
包括选用的数据分析策略、分析模型、有关变量的使用及对分析结果的解释与推论等。
(二)研究方案的对照检查提纲
一项流行病学研究的研究方案拟定后,往往需要反复检查、斟酌、修改,以保障在研究完成后能达到预期的研究目的。以下是一份针对病例对照研究设计方案的对照检查提纲(Schlesselman,1982),不仅可以指导病例对照研究的设计方案,对其他类型的流行病学研究设计也具有参考价值。
1.研究背景
(1)是否已全面复习了有关的文献?
1)国外的文献复习了没有?
2)国内的文献复习了没有?
3)最近发表的主要综述性文献阅读了没有?
(2)是否对以往有关的研究结果做了评价?
1)相关流行病学研究工作。
2)与流行病学研究有关的研究工作,如基础研究、动物实验等。
(3)基于已了解的背景,需要在哪些方面做进一步的研究?还需要获取哪些新知识?
(4)本研究是否与问题(3)所提出的研究任务相吻合?本研究能否对已有的研究作重要的补充、充实或验证?
(5)本研究的目的和意义是什么?本研究将使哪些人和哪些学科领域受益?社会、经济效益如何?
2.研究目的
(1)本研究的具体目的是什么?是探索性研究,还是从某一方面深入的分析性研究?
(2)本研究的主要假设是什么?是否很简练而明确地将假设予以表达?
(3)是否还想研究、分析假设之外更多一些的问题?具体包括哪些?
3.研究设计
(1)本研究的方法是否能够检验所提的假说?所选用的具体方法是否对本研究最为合适?是否需要其他方法?能否证明所选用方法的正确性?
(2)所需的研究对象数量是否有把握获得?
(3)如果可以使用盲法进行研究,是否已经采用?
(4)统计分析的方法是如何考虑的,会不会在分析阶段还需要其他方法?
(5)调查问卷与试验仪器以及试剂、药品是否都已齐备?有无在实施过程中更换的可能性?
(6)研究现场的条件是否了解?与合作者是否已达成了协议?合作内容是否均作了安排?
(7)物质的、经济的、技术的、行政的等各方面的申请或安排,是否得到有关部门的批准?
(8)所需经费、设备和人力是否已经精确地估算?
4.研究对象的选择
研究对象可分为4种类型,即患者、非患者、暴露于研究因素者、非暴露于研究因素者。
(1)所有这些研究对象,定义是否均已明确?
(2)对病例来说,排除该病和确定该病的标准是否很明确、具体?使用的是新发病例还是现患病例?是在规定地区内选择的,还是临时由其他地区选择的?可否获得足够的样本数?具体措施是什么?
(3)若为患者对照,要明确是来自医院还是来自社区。一个病例匹配几个对照?配比的变量、数目和方法是否明确、恰当?
其他研究类型的研究对象可模仿上述例子予以对照核查。
5.研究的准备与实施
(1)要不要进行预试验?
(2)调查问卷是否已经准备好?计划调查和测定的项目是否均已列入?不必要的项目是否都已删掉了?是否还需要其他表格?
(3)调查问卷是由研究对象本人回答还是由调查员去调查?调查员是否已经经过良好的培训?
(4)是否需要来自医院的病案或其他信息来源摘录信息?是否需要用其他特殊表格来记录体检或实验室检查的结果?
(5)能够评价所用各种研究方法或工具的真实性与可靠性吗?
(6)可用什么方法来提高和促进被调查者回忆的精确性与完整性?
(7)所获得的信息是否足以进行分析比较,例如病例与对照之间某些方面较细致的比较?
(8)是否收集了关于潜在的混杂因素的信息?
(9)何人负责收集、保存数据和控制数据的质量?何人负责监督调查员和其他工作人员的工作?
(10)是否编写了供调查员、信息摘抄员等人使用的工作手册?是否对其中有关事项都做了明确的规定?如何能使各有关工作人员均能准确地按既定的工作程序操作?
6.数据整理与分析
(1)数据总的处理分析方案是什么?对要研究的变量、指标是否已明确?
(2)如果拟分析剂量反应关系,是否对资料已做了相应的准备?
(3)如何在分析时检验和排除某些因素可能带来的偏倚?
(4)如何评价相关因素之间的交互作用?
(5)若做分层分析,在数据整理分析时的分层是否和设计时一致?
(6)如何评价无应答者对研究结果的影响?有否搜集这方面的资料?
(7)数据分析可否评价设计时的假说,是否达到预期的研究目的?
(吴 静)