前言
一、统计应用的特点
在计算机技术迅猛发展的今天,政府和企业的统计应用已逐渐呈现以下特征:
第一,数据量和数据关系复杂性快速膨胀
数据量和数据关系复杂性快速膨胀是目前统计应用中遇到的主要问题。通常,一般规模的统计分析项目中,数据量可达到百万条甚至近千万条。统计应用也不再以统计年鉴和统计报表的纸面方式获得数据,而要求直接从电子化多媒体化的基础业务系统、管理信息系统和决策支持系统的数据库(数据仓库)中提取数据。利用计算机和网络进行有效的数据组织和数据管理已经成为统计应用的基本环节和基础方式。
第二,数据分析方法日益丰富
在数据处理和数据分析中,以坚实的数学理论为基础的统计分析方法已获得广泛应用。近年来以计算机技术为动力的数据挖掘技术也为数据分析增添了新的方法和思路。机器学习、神经网络和生物遗传算法等已成为处理海量数据,探索数据内在规律性,提取数据中未知知识的重要手段。这些数据分析方法的成果不断地体现在统计分析软件和数据挖掘软件体系中,并通过强大的计算机处理能力和网络分布处理能力进行模型的高速计算。
第三,统计应用需要具有可操作性的整体解决方案
传统的统计业务处理流程是报表上报、人工汇总、撰写分析报告,最终实现为有关管理决策部门提供信息监督和咨询服务的目标。统计应用的科研长期以来也沿用了这种套路,即由统计业务方提供数据,由统计方法专家进行数据分析、撰写分析报告和提供咨询建议。这样的应用方式存在两个主要问题:首先,许多企事业单位统计应用起点较低,基础较薄弱,无法提供完善的报表支持,出现或资料不完整或没有电子化的数据来源等问题,使得统计分析常常成为无米之炊;其次,不定期的统计报告方式难以满足统计业务的长期发展需要。目前,越来越多的统计应用要求研究人员提供能够与统计业务绑定的、可长期运行的、具有可操作性的统计应用整体解决方案。这个整体方案将统计业务处理功能、统计数据、统计分析方法完整地集成起来。因此,如果没有一个符合企事业单位统计业务自身特点的统计信息系统,统计分析方法的应用将很难实现健康的、落地生根的、滚动式的发展。
总之,如果说数学是统计方法的首要工具,那么,统计应用软件已经成为统计应用的首要工具。