上QQ阅读APP看书,第一时间看更新
第三章 大数据技术
第一节 大数据技术发展现状与趋势
一、基本概念
大数据概念最早出现在20世纪80年代的美国。2008年9月《Nature》杂志发表文章《Big data:Science in the Petabyte Era》,大数据概念开始广泛应用和传播。
2011年麦肯锡《大数据:下一个前沿,竞争力、创新力和生产力》报告认为大数据是指其大小超出了常规数据库软件的获取、存储、管理和分析能力的数据集,指出目前大数据的一般范围是从几个TB到数个PB。
国际数据资讯(international data corporation,IDC)从大数据的4个特征来定义,即海量的数据规模(volume)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)、巨大的数据价值(value)。
Amazon大数据科学家John Rauser认为大数据是任何超过了一台计算机处理能力的数据量。
维基百科认为大数据是由于规模、复杂性、实时而使之无法在一定时间内用常规软件工具对其进行获取、存储、搜索、分享、分析、可视化的数据集合。
大数据技术则是指从各种各样类型的巨量数据中,快速获得有价值信息的技术,主要包括数据收集、存储、检索、共享、分析以及可视化等技术。