1.2.1 数据基本知识
数据是各种符号,如字符、数字等;数据也是原始事实的符号记录,如声音、图片动画、视频多媒体等。要保证其原始性和真实性,需要进行后期加工。信息是人们为了某种需求而对原始数据加工重组后形成的有意义、有用途的数据。
在信息系统的表达上,可以把数据放在输入端,把信息放在输出端。从信息的角度看,数据可以从数据输入和输出的位置得到理解。图1-6所示为信息系统工作图。
图1-6 信息系统工作图
人们掌握数据资源是为了提炼数据得到有用的资源,称为信息。在信息的基础上提炼和总结成具有普遍指导意义的内容,包括共性规律、理论、模型模式方法等知识。运用知识,结合经验创造性地预测未来,解释现象和问题,从而形成智慧。从数据到智慧的升级也是从认识局部到认识整体,从描述过去或现在到预测未来的过程。图1-7所示为从数据到智慧的阶梯。
图1-7 从数据到智慧的阶梯
数据处理技术包括数据的采集、存储、处理、分析、表现等,目的是把数据变成有价值的信息,乃至将数据挖掘或处理升华成知识。
数据、信息和知识三者既有区别又有联系:数据是信息的载体,是信息的原始记录,包括数字、语言、文字、声音、图形、图像等多种形态;信息是经过加工后的对某现象具有一定解释力的数据,或者说是有价值的数据;知识是对信息的进一步提升,是更加系统化、理论化的信息。运用知识并结合经验创造性地预测、解释和发现是智慧。
知识拓展
OLTP和OLAP
事实上,数据处理技术与信息处理技术并无本质区别,都是解决如何将数据处理加工成信息乃至知识的技术。如果非要加以区分的话,那么可以认为联机在线事务处理(On-Line Transaction Processing,OLTP)是侧重于数据处理的技术,而联机在线分析处理(On-Line Analytical Processing,OLAP)是侧重于信息和知识处理的技术,而这种区分只能说是“侧重”而已,实际并无绝对界限。数据处理是基础(例如,将原始的有“噪声”的数据经过“清洗”等处理,变成可以进一步加工处理的数据),信息处理是在此基础上的更高一层的应用,两者紧密相连,不能完全隔离开来。