6 统计技术
研究怎样去有效地收集、整理和分析带有随机性的数据,以对所考察问题作出推断和预测,直至为采取一定决策和行动提供依据和建议,这就是统计技术要解决的问题。数据看成是来自具有一定概率分布的总体,所研究的对象是这个总体而不能局限于数据本身。用统计技术解决问题一般有以下步骤:建立数学模型,收集整理数据,进行统计推断、预测和决策。这些步骤可以交互进行。
模型的选择和建立是对总体分布规定的类型。如线性回归模型,在回归函数是线性时适用。又如,在分析测量误差时,有理由选择正态分布模型。在电子元件的老化作用可以忽略不计时段内,有理由认为元件寿命服从指数分布等。
抽样是指从一些有形的个体组成的总体中抽取一部分,测定其有关的指标值。安排特定实验以收集数据,是通过实验去“造出”总体中的个体。在一定的生产条件下,所能生产的某种产品的质量指标的总体是属于“造出”的。实验需要有计划地安排,各种工艺因素有温度、压力、时间等,因素又有几个不同水平,这是实验设计的技术。根据总体模型以及由总体中抽出的样本,需作出某种推断。如1万件产品中随机抽出200件做质量检测,残次品为4件,推断1万件的残次品为2%。随机变量在未来某个时刻所取的值,是统计预测。如武汉根据100年的水位(武汉关)资料,预测2010年后最高水位是多少米。统计推断和统计预测有相似之处:一是要依据一定的统计模型和观察数据。二是都要超出自己观察的事物范围。但也有不同:统计推断是总体中一些方面,而统计预测对象是未知的、随机的。根据统计推断或统计预测,并考虑行动后果,再来制定行动方案。如某商业公司要决定某货物进货数量,公司根据推断和预测,决定进货1000件。但积压1件损失20元,而少销售1件少得10元。
统计技术是各个领域应用最广泛的数学技术之一。统计技术最先是从农业田间试验中发展起来的。如种子品种、施肥的种类和数量以及耕作方法的选定,都需制定试验方案,对有效性要进行统计分析。又如在遗传力的计算上,用了很复杂的回归模型和方差分量分析法。工业应用同样十分广泛,诸如试制新产品、改进老产品、改革工艺流程、使用代用原材料和寻求适当配方等都需使用正交设计、回归设计与回归分析、方差分析、多元分析等统计技术。医学上的应用也极为广泛。如防治一种疾病,需要找出导致这种疾病的种种因素。又如要研究肺癌的发生与吸烟的关系,大量统计资料表明,具有正相关关系,且相关系数较大。计算机的广泛使用,使得统计技术发挥越来越重要的作用。现在许多统计模型都可以直接使用软件包或通用的统计软件包。