第一节 卫生统计学的基本概念和基本步骤
一、基本概念
(一)同质和变异
同一总体中每个研究对象具有相同性质类别的特征称为同质(homogeneity)。同一总体中各研究对象间的差异性则称为变异(variation)。
(二)总体和样本
总体(population)是根据研究目的确定的同质研究对象某观测指标的全体。样本(sam-ple)是从总体中随机抽取的有代表性的一部分研究对象,其某个观测值的集合。样本含量是样本中所包含的研究对象个数,又称样本大小,通常用n来表示。
(三)变量和资料
变量(variable)是研究对象的某种特征或属性,变量的观测值称为变量值,也称为数据。更准确地说,数据是指研究对象的原始记录或从原始记录过录者。在统计学中,常常又将数据统称为资料。根据资料的性质,可将其分为3类:定量资料(quantitative data)、无序分类资料(unordered categorical data)和有序分类资料(ordinal categorial data)。
1.定量资料 亦称数值变量资料(numerical variable data),是测定每个观察单位某项指标的大小而获得的资料,其变量值是定量的,表现为数值大小,一般有度量衡单位,如心率、血脂等。
2.无序分类资料 亦称定性资料(qualitative data),是将观察单位按照某种属性或类别进行分组计数汇总而得到的资料,其变量值是定性的,表现为互不相容的属性或类别,如性别、职业等。
3.有序分类资料 亦称等级资料(ranked data),是将观察单位按照某种属性的不同程度分为若干等级,分组计数汇总而得到的资料,其变量值具有半定量性质,表现为等级大小或属性程度的不同,如疗效分级、心动能分级等。
(四)参数和统计量
参数(parameter)是描述总体特征的数值指标,通常用希腊字母表示,如μ、σ、π、ρ和β分别表示总体均数、总体标准差、总体率、总体相关系数和总体回归系数。统计量(statistic)是描述样本特征的数值指标,通常使用拉丁字母表示,如x、s、p、r和b分别表示样本均数、样本标准差、样本率、样本相关系数和样本回归系数。
参数是总体本身固有的,统计量随着样本的不同而不同,但其分布有一定的规律性,这种规律是统计推断的理论依据。
(五)误差和抽样误差
误差(error)是指观察值与真实值之差。根据来源不同,误差可分为系统误差、随机误差、过失误差和抽样误差。抽样误差(sampling error)是由于个体变异的存在,在抽样研究中表现出来的统计量与统计量之间或统计量与参数之间的差异。
(六)概率
概率(probability)是描述随机事件发生可能性大小的一个定量指标,常用P表示,取值在0~1之间。当随机事件发生的可能性P≤0.05或P≤0.01时,该事件在统计学中通常称为小概率事件。小概率事件在单次试验中可以认为不会发生,此即为小概率事件原理。小概率事件原理是进行统计推断的理论依据之一。
(七)参考值范围和可信区间
参考值范围(reference interval)亦称正常值范围(normal interval),是指特定人群的形态、功能、生化等各种指标的波动范围,其中特定人群是指没有对观测指标有影响的疾病或因素的人群。参考值范围可以作为临床医生诊断的参考依据,同时人群在某项指标上的动态变化,也间接反映了社会经济发展、人群营养状况和环境污染程度等方面的变化。
可信区间(confidence interval, CI)是按一定的概率或可信度来估计参数所在的范围,相应的区间叫可信区间或置信区间,可信度一般取95%或99%。
(八)相关系数和回归系数
相关系数(correlation coefficient)是描述两个数值变量资料之间密切程度和方向的一个定量指标,总体相关系数用ρ表示,样本相关系数用r表示。回归系数(regression coeffi-cient)是表示自变量变化的一个单位,因变量平均变化的单位数,总体回归系数用β表示,样本回归系数用b表示。
二、基本步骤
(一)设计
研究设计包括专业设计和统计学设计,前者着眼于从专业的角度对选题的创新型、科学价值、可行性等方面考虑;后者从统计学的原理出发,对一项科学研究从获取数据到分析数据、解释结论的全过程进行周密合理的统筹安排,包括目标总体的确定、抽样方法的选择、资料收集、整理和分析等总的过程和设计。在设计过程中需要遵守实验设计的四大原则:随机化原则、重复原则、对照原则和均衡原则,在临床实验设计中还应该遵守盲法原则。
(二)资料收集
收集资料的目的是取得可靠有效的原始资料。资料来源是多方面的,大致可以分为工作报表、工作记录和专题资料。国家法定的有关卫生工作报表,如传染病报表、职业病报表、医院工作报表等,这些报表是由国家统一设计的,要求有关医疗机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,作为制定卫生工作计划与措施、检查与总结的依据。报表要做到完整、准确、及时。经常性工作记录包括经常性卫生监督记录,健康检查记录和病例等。专题资料是根据课题需要进行专题调查或专题实验获取的资料。
(三)资料整理
旨在净化原始数据,其任务是使收集到的资料条理化、系统化,以便于进一步的计算和分析。首先是资料清理,接着是建立数据库,然后使用频数分布表来整理。
(四)资料分析
根据研究目的计算有关指标,制作相应统计图表,反映数据的综合特征,阐明其中的规律。统计分析包括统计描述和统计推断,统计描述通常采用指标、统计图和统计表等方法对资料的数量特征及其分布规律进行描述;统计推断用样本信息来推断总体特征,包括参数估计和假设检验。
(五)结果解释
通过统计分析结果对相应的专业问题作出理性的判断,结合专业知识进行合理的解释。
统计工作人为地分为以上5步,但是它们是紧密联系、不可分割的整体,缺少任何一步都会影响到整个研究的结果。