第2章 常见统计设计
统计方法的选择可以总结为15字口诀:方法看变量,设计看类型,目的定乾坤。意思是选择哪一类统计方法首先看变量到底属于我们前面说的三种中的哪一种,然后决定统计方法,具体统计方法选择哪一类型,得看设计类型,当然最终方法的选择还得考虑研究的目的,比如某班级不同性别两组大学生比较体重,一看研究指标是体重,为计量变量,而且是2组,基本就考虑是t检验了,可是t检验有3种,到底如何选择呢?因为给出的不同性别两组大学生,男女生之间相互独立,因此本例应该选择2独立样本t检验(此时数据应该符合独立、正态、方差齐,否则还得换方法)。这个例子有点早,还没怎么开始学,可能读者理解不了。下面我们就先学习统计设计,然后回头看这个例子也许会好点。
2.1 成组设计
成组设计是一种将受试对象随机分组或者按照某种属性特征将受试对象分配到2组或K组中去。它的特征为组间的受试对象相互独立。成组设计模式图见图2-1和图2-2。
图2-1 成组设计——2组模式
图2-2 成组设计——K组模式
大家注意,统计学上存在一种“2K效应”,成组设计中的2组与K组(K≥3),虽然设计都是成组设计,但后续采用的统计分析方法是不一样的!如研究变量为计量变量,成组2组设计优先考虑2独立样本t检验,而K组优先考虑单因素设计方差分析。
2.2 配比设计
配比设计是指受试对象按照一定的条件进行匹配,然后再随机分组的方法,包括配对设计和配伍组设计。
2.2.1 配对设计
配对设计见图2-3,包括同一组受试对象干预前后配对(A);同一个受试对象身体不同部位配对(B);条件相同的2个受试对象配成对子,然后随机分到2组中设计(C);以及同一份标本分别接受不同的处理(D)。
图2-3 配对设计四种类型模式
2.2.2 配伍组设计
配伍组设计为配对设计的进一步扩大,如图2-4所示,每一种情况都是对图2-3的扩大化。其中的A为干预前、中和后,这种情况当是单组设计时可以当作配伍组设计方差分析,但当是多组设计时,应该考虑用重复测量数据方差分析;B为同一个受试对象对身体K个部位进行检测;C为按照条件选择K个受试对象构成一个配伍组,然后配伍组中的每个受试对象随机分配到各组中去;D为同一份标本采用K种方法检测。
图2-4 配伍组设计四种类型模式
2.3 析因设计
问大家一个问题,比如果园里一个男性工人每小时单独可以摘100个苹果,一个女性工人单独可以采摘80个苹果,请问一男一女搭档工作,一小时采摘180个苹果吗?松哥并不想让你们告诉我答案,只想你们能达成一个共识,就是因素与因素之间可能会发生相互影响,也就是交互作用。
同样,统计学当研究多因素的时候,因素与因素之间也可能发生交互作用,可是我们可以通过什么方法进行研究呢?本节的析因设计就是研究交互作用的一种方法。
析因设计是多因素多水平全面组合,每一种组合就是一个研究分组的试验设计方法。试验设计模式图见图2-5。图中可见研究2个因素,因素A有用和不用2个水平,因素B有用和不用2个水平,2×2全面组合,将有4组,如图中4个框。
图2-5 析因设计模式
此时,我们可以进行三次假设分别解决三个问题,即因素A有没有效果、因素B有没有效果,以及A×B之间有没有交互作用。析因设计是一种非常浪费样本量的方法,因此实际工作中研究因素一般不超过3个,水平数亦不可过多。如3×3×3析因设计,共27组,按照每组10只老鼠计算,270只老鼠,再适当扩充一点以防止老鼠死亡损失,则300多只老鼠,这对于一个课题组而言是不可思议的,很难保证这么多老鼠的干预措施的同质性。如果研究因素较多,可以考虑正交设计或者均匀设计的方法。
2.4 重复测量设计
重复测量设计是近年受到重视的一种设计,该设计是指对同一个受试对象在不同的测量时间点进行重复检测的设计。
图2-6 重复测量数据模式
注意:重复检测必须在同一个受试对象上,很多实验取材检测需要处死受试对象,此时已经不能算作重复测量设计。一句话,坚持住不能死,一定要做“鼠坚强”,否则应该当作析因设计进行分析。
2.5 其他设计
其他设计还包括交叉设计、正交设计、拉丁方设计、嵌套设计、均匀设计等,此处不赘,当讲到相应内容时再讲解。