项目一 统计概述
项目概述
在我们的生活和工作中,统计的影子无处不在,小至一家的柴米油盐,大至一国的宏观决策。在当今的数字化社会和信息时代,统计科学的影响越来越大。统计数据是经济社会管理的基础依据;统计分析为决策提供重要参考;统计方法服务于科学研究。统计已融入老百姓的生活。
学习统计,首先要对统计有一个总体的认识,并且要掌握统计的思想观和方法论。具体来说,就是要认识什么是统计、统计具有哪些特点、统计的工作过程包括哪些环节、统计能够发挥哪些职能与作用、统计的研究方法主要有哪些、统计学中基本概念有哪些等基本问题。
学习目标
1.理解统计的含义、特点,了解统计的工作过程、职能与作用。
2.认识统计的研究方法,掌握统计的思想观与方法论。
3.认识统计学中常用的基本概念。
★导入案例
会说话的数据
南丁格尔有一句名言:如果想了解上帝在想什么,就必须学统计,因为统计学就是在测量上帝的旨意。这里所说的上帝就是我们的客观世界。统计可以告诉您更多事实,下面讲几则有关统计学的故事。
第一个故事:超市销售额有规律吗?1993年,一位美国人发现,在超市里有67%的顾客在买啤酒的同时,也买了尿布。是顾客喝完啤酒以后用尿布吗?显然不是。进一步调查发现,在购买尿布的人中有80%是年轻的父亲,在购买尿布时,他们顺便为自己买点啤酒。商家发现这样的规律后,便在超市里把啤酒和尿布放在一个货架上,以方便年轻的父亲,结果两种商品的销售额大增。这种用于商品的货架设计、存货安排,根据购买模式对客户进行分类的方法,就叫数据挖掘。数据挖掘是统计学中一个比较新的研究方向和领域,是把统计学、数学、计算机、人工智能、继续学习等各种方法融合在一起的一个边缘学科。数据挖掘的商用价值相当大,利用数据挖掘可以使统计学在为社会服务方面走得更远。
第二个故事:“垃圾不只是垃圾”。柯的斯出版公司是美国乃至世界上首先设立市场调研组织的企业,帕林是柯的斯出版公司的经理。曾经,柯的斯出版公司的业务代表向美国鼎鼎有名的坎贝尔汤料公司推销“星期六邮刊”的广告版面。但对方告诉他,“星期六邮刊”不是坎贝尔汤料公司的好媒体,因为“星期六邮刊”的主要读者是工薪阶层,而他们的汤料以高收入家庭购买为主。原因是:工薪阶层主妇为了省钱,往往凑合着自己烧汤,只有高收入家庭才愿意花10美分买已经调配好的坎贝尔汤。帕林要想办法得到信息以指出坎贝尔汤料公司广告部对市场的这些观点是否正确。为此,帕林抽取了一条垃圾运输线,让人从该线路的各个垃圾堆中收集汤料罐。结果发现,从富裕区几乎没有收集到汤料罐,大部分汤料罐是从蓝领区收集到的。究其原因是:富裕家庭总是让仆人动手准备汤料,而蓝领阶层的妇女往往会节约做汤时间以便更多地为家人做衣服或者做其他挣钱的活。在摆出这些发现后,坎贝尔很快成为“星期六邮刊”的广告客户,从此“垃圾调研法”产生了。
第三个故事:文字DNA。1928年,有人提出《静静的顿河》作者不是肖洛霍夫,而是克留柯夫。1974年,一个匿名的作者在巴黎写了一本书,断言克留柯夫是《静静的顿河》的真正作者,肖洛霍夫则是一个剽窃者。为了弄清真相,一些学者用统计方法进行了考证,具体做法是:把《静静的顿河》同肖洛霍夫与克留柯夫两个人没有疑问的作品用计算机量化,采集数据,加以分析比较。研究结果表明,《静静的顿河》与肖洛霍夫的其他作品非常接近,与克留柯夫的作品则相去甚远,有充分把握推断出《静静的顿河》的作者就是肖洛霍夫,从而了结了长达数十年的文坛公案。这种统计学的新分支叫作文献计量学,主要的功能就是通过文献来搜寻信息。比如,要判断《红楼梦》前80回和后40回是不是一个人写的?如果不学统计,你可能要下数十年的功夫,使自己几乎成为一个“红学”家,要对那段生活的历史、文化、民俗,对曹雪芹、高鹗的风格,做一个全方位的比较,才能够做出一个判断。如果学了统计,把《红楼梦》的前80回和后40回进行对比,看看虚词的使用、句子的长度、标点使用的一些习惯,就可以判断出来,国外把这叫作文字DNA。日本京都大学村上教授有一个著名的案例。有一个人去世以后,别人伪造了一份遗嘱。村上教授把这个人生前所有写的信件、书籍作为一个新的样本,与假遗嘱进行对比,发现遗嘱不是此人的行文风格,法院就以此为依据做出相应的判决。
思考:
通过以上资料学习,请你描述什么是统计?统计具有哪些重要意义?