上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第1章 医疗大数据概述
虽然大数据这个概念是近些年才提出的,但大型数据集的起源可追溯至二十世纪六七十年代。当时数据世界正处于萌芽阶段,全球第一批数据中心和首个关系数据库便是在那个时代出现的。
2005年左右,人们开始意识到用户在使用Facebook、YouTube及其他在线服务时会生成海量数据。同一年,专为存储和分析大型数据集而开发的开源框架Hadoop问世,NoSQL也在同一时期开始慢慢普及。
Hadoop及后来的Spark等开源框架的问世对于大数据的发展具有重要意义,正是它们降低了数据存储成本,让大数据更易于使用。在随后的几年中,大数据的数量呈爆炸式增长。用户目前仍在持续生成海量数据,而且并非只有人类在产生数据。
然而,尽管已经出现了很长一段时间,但人们对大数据的利用才刚刚开始。如今,云计算进一步释放了大数据的潜力,通过提供可扩展性,它能够让开发人员轻松启动Ad Hoc集群来测试数据子集。此外,图形数据库也变得越来越重要,因为它能够显示大量数据,在某种程度上使分析变得快速、全面。
医疗大数据是大数据在医疗领域的一个分支,本书将对医疗大数据进行全面、透彻的分析。