第二节 统计学的应用与分科
一、统计学的应用
统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。目前,随着定量研究的日趋重要,统计方法已被应用到自然科学和社会科学的众多领域,统计学也已发展成为若干分支学科组成的科学体系。可以说,几乎所有的研究领域都要用到统计方法,比如日常生活、公司或企业的生产经营管理、政府部门和学术研究领域等。下面列出一些统计方法在不同领域中应用的例子。
1. 生活中的统计学
在我们在日常生活中,经常遇到与统计相关的问题,只要我们自觉地运用统计学的角度看问题,就能更容易看清事物的本质,以在我们生活中最为常见的彩票为例。人们购买彩票都想中大奖,希望能用2元钱获得500万元的大奖。殊不知,大家在抱着这样的心态购买彩票时,却很少理性计算中奖的概率。以国内流行的体彩七星彩和福彩双色球为例,只要稍加计算,就能知道我们有多少胜算。体彩七星彩的玩法如下:该类体育彩票每注由7位自然数组成,每一位数字都有0~9共10种变化,其排列组合共有10×10×10×10×10×10×10种,即10的7次方,也就是共有1000万注,中一等奖的概率是。而福彩双色球(33选6、16选1)中头奖的概率是
显然,用2元钱博得500万元的大奖这样的小概率事件在统计学中被认定是几乎不可能发生的事情。即便有的人实在受不住大奖的诱惑,也可以比较这两种彩票中奖的概率,理性地选择购买体彩七星彩,从而增加自己中奖的概率。
2. 企业中的统计学
在企业的生产经营活动中,时时刻刻都在利用统计信息作为其行为的指南。充分有效的统计数据能够使企业在了解市场供求状况、把握投资机会、选择投资方向、降低投资风险、调整产品结构、加快产品开发、制定发展战略、加强产品质量管理、进行财务分析以及进行市场前景预测等方面都具有积极的作用。
以我国影碟机市场为例来说明统计学在企业决策方面的指导作用。20世纪90年代末,我国影碟机市场已经进入“微利时代”,影碟机厂商之间的竞争已达到白热化,影碟机厂商是要在这个微利市场继续经营,还是要改变投资方向选择退出呢?他们在做出决策之前会对这个市场进行详细地调研,考虑众多因素后再对其经营进行抉择。2000年蓝田市场研究公司对全国31个城市的影碟机市场中消费者未来两年购买影碟机的意向进行了统计抽样调查,调查样本家庭用户总计22429个。图1.1说明了全国城市居民当时购买影碟机的意向。
图1.1 全国消费者两年购买影碟机的意向(2000年)
从图1.1中的统计数字可以看出,城市的影碟机市场发展空间有限,在所有被访家庭中,仅有14.4%的家庭未来两年内有打算购买影碟机的意向,影碟机在城市市场的发展空间狭小。这些信息为影碟机厂商经营决策提供了重要的参考。
3. 军事中的统计学
统计在军事中也起着极为重要的作用。要打赢高技术条件下的局部战争,必须对有限的军需资源进行有效合理的配置。完善成熟的三军联勤体制是使军需资源达到最优配置的制度保障,而要使这一体制得以正常运作,获得及时、准确、充分、翔实的军需资源统计信息就显得至关重要。比如,在瞬息万变的战场,必须随时计算士兵的伤亡率,战时物资消耗率,给养食品利用率等各种指标,只有这样,指挥者才能实时监控战争动态,才能将有限的军需资源如作战口粮、救生口粮等进行合理有效的配置,确保战争的胜利。
4. 政府中的统计学
对国家的宏观经济调控是现代政府部门管理国家的一项重要职能,宏观经济政策关系到一个国家经济的健康发展。而宏观经济政策的制定与实施的主要依据是统计部门为政府提供的相关统计指标和数据,比如,国内生产总值(GDP)增长率、通货膨胀率、失业率等指标数据。政府部门根据这些数据进行宏观经济预警,进而采取有针对性的政策和措施,避免国家经济出现大起大落。
5. 科学研究中的统计学
在统计学产生与发展的历史进程中,统计学几乎广泛应用于各门学科的相关研究中,从自然科学、社会科学到人文科学,成为科学研究必不可少的工具。下面举一个人们知其甚少的统计学在文学研究中应用的例子。
我国古代四大名著之一《红楼梦》的著作者一直存有争议。众所周知,《红楼梦》一书共计120回,自从胡适作《红楼梦考证》以来,一般认为前80回为曹雪芹所著,后40回由高鹗所续。尽管如此,红学界仍对这个问题争论不休,争论主要集中于后40回是否为高鹗一人所续。那么,怎样对这个争论作一个客观的论证呢?统计学给我们提供了一个客观的方法。20世纪80年代,复旦大学的李贤平副教授和他的学生对这一争议从统计学的视角进行了新颖的注解。他们将《红楼梦》看成是120个样本,然后确定与情节无关的47个虚词(之,其,或,亦,……;呀,吗,咧,罢,……;的,着,是,在,……;可,便,就,但,……,儿等)作为变量。我们知道,不同的作家由于写作特点和习惯的差异,在描述相似的情节时,所用的虚词是有差别的。根据每一回中这些虚词出现的次数作为数据,然后利用多元统计分析中的聚类分析法对这120组数据进行分类,结果果然是两类,前80回一类,后40回一类,这就客观形象地证实了红楼梦不是出自一个人的手笔。他们进一步分析,前80回是否为曹雪芹所写?找一本曹雪芹的其他著作做类似分析,结果表明虚词用词手法一致,证明了前80回确实出自曹雪芹之手。而后40回又是否为高鹗所写呢?论证结果推翻了后40回为高鹗一人所续的说法,而是曹雪芹亲友将其草稿整理而成,宝黛故事为一人所写,贾府衰败情景当为另一人所写,等等。这个论证结果在红学界引起了很大的轰动,李教授用多元统计的方法解释了红学界争论多年的问题,使红学界大为赞叹,它从客观的文本入手,不带有任何主观色彩,可信度自然也很高。
我们所学的统计学就是这样一门应用性学科,它用于社会生活的方方面面。通过对它的学习,掌握基本的统计理论和方法,了解信息时代怎样收集信息,怎样对收集到的信息进行整理和分析,从中我们得出有价值的结论来。个人利用统计信息进行科学理财和做出更为理性的决策;企业利用数据信息来分析经营决策环境,研究供求状况,指导企业活动;政府部门利用统计数据和资料进行宏观经济调控,克服市场失灵,实现资源的优化配置。
拓展讨论
利用统计学知识解释《红楼梦》著作归属问题令人不禁赞叹,同学们不妨也对自己感兴趣的篇章中的某些部分进行统计分析,说不定也能发现意外惊喜。
二、统计学的分科
统计学在其他学科中的广泛应用使得统计学逐渐呈现与其他学科交叉融合的趋势,比如,与生物学的交叉,形成生物统计学;与医疗卫生的交叉,形成卫生统计学;与人口学的交叉,形成人口统计学;与金融学的交叉,形成金融统计学,等等。统计学为多个学科提供了一种共同的数据分析方法,使学科的界限变得越来越模糊,进而逐渐发展成为若干分支学科组成的学科体系。大体来说,根据统计方法研究和应用的侧重点不同,可以将统计学分为理论统计学和应用统计学,根据统计方法的构成不同,可将统计学分为描述统计学和推断统计学。
1. 理论统计学和应用统计学
理论统计学是以数学原理为核心的统计学,它主要研究统计学的一般理论和统计方法的数学理论。现代统计学的一个重要特点是充分利用现有的数学理论成果,一般来说,从事统计理论和方法研究的人员需要具备坚实的数学基础,数学中的概率论是统计推断的理论基础。正因为如此,广义的统计学是包括概率论在内的。理论统计学是统计方法的理论基础,没有理论统计学的发展,统计学也不可能发展成为今天这样一个完善的科学学科体系。
与很多学科一样,在统计研究方面,从事理论统计学研究的人只占据很少的比例,而大部分人的研究集中在统计学的应用领域。应用统计学就是如何运用统计学方法去解释和解决实际问题的学科。由于统计学是一门研究大量社会现象数量方面的方法论科学,无论是自然科学领域还是社会科学领域,都存在数量现象和需要通过数据来发掘其内在的规律性,进而达到解决实际问题的目的,因此,统计方法的应用几乎拓展到所有科学研究领域。正如在前面阐述的那样,统计方法在金融学中的应用形成了金融统计学;统计方法在生物学中的应用形成了生物统计学;在医学中的应用形成了医疗卫生统计学;在农业试验、育种等方面的应用形成了农业统计学,等等。这些不同的分支学科所运用的基本统计方法和理论都是一样的,但由于各应用领域都有其特殊性,统计方法就在应用的时候又形成了一些不同的特点,通过对统计数据分析得出的结论需要各专业学科提供的专业知识才能得到进一步的解释。
2. 描述统计学和推断统计学
描述统计学(descriptive statistics)是研究如何取得反映客观现象的数据并通过图形、表格和概括性的数字对数据进行描述的统计方法,通过对统计数据信息进行加工、分组、编制统计表、绘制统计图以及计算平均数、方差等,从而综合与分析得出反映客观现象的规律性数量特征和数量关系。对所收集的数据资料进行描述是统计分析的起点和基础性工作,其主要动机是使反映客观事物的统计数据可以一目了然、条理清晰,并能简洁地概括事物的根本特征。对统计数据的收集、整理与显示,以及数据分布特征的测度等,在本教材的以后章节会详细说明。例1.1通过绘制人数分布区间柱形图说明了描述统计学的一些基本特征。
【例1.1】 表1.1是20××级物流管理某班统计学原始成绩表。根据这个原始成绩表,试对该班的统计学成绩按人数分布画出柱形图。
表1.1 20××级物流管理某班统计学原始成绩表
根据表1.1的数据,我们可以通过电子表格对该班统计学成绩进行简单的描述统计。本章只给出该班人数的分数分布区间,画出柱形图,从而对描述统计有一个大致的认识,关于描述统计的详细内容和分析步骤,本教材后面的章节中有系统的介绍。
根据表1.2的分布区间,可以利用电子表格生成人数分布柱形图,见图1.2。
表1.2 20××级物流管理某班统计学成绩人数分布表
图1.2 20××级物流管理某班统计学成绩人数分布图
推断统计学(inferential statistics)是研究如何根据抽样出来的样本数据去推断事物总体数量特征的方法,包括对总体进行估计、假设检验、预测等。它是在对样本数据进行描述统计的基础上,对统计总体的未知数量特征和规律做出概率形式的表达。例如,在财务的审计中,审计人员并非对所有发票进行一一审查,而是抽取一定数量的发票作为样本发票,然后根据样本发票估计数额巨大的发票产生错误的概率。又如,美国盖洛普(Gallup)调查公司在美国总统大选前通常会从全美国的选民中随机抽取l 500人左右,调查这些选民的总统选举意向,盖洛普调查公司根据抽样调查的结果在允许有2%左右误差的条件下,对大选结果进行预测。这是两个利用样本信息推断事物总体特征的代表性例子。
描述统计学和推断统计学几乎包含了现代统计学的全部内容。描述统计学是整个统计学的基础,统计学分析问题的出发点就是运用描述统计学所收集出来的统计数据并提供有效的样本信息。然后,推断出事物的总体数量特征是推断统计学的主要任务。值得说明的是,在现实问题的应用研究中,由于我们获得的数据主要是样本数据,因此,推断统计学在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。