大数据技术与应用
上QQ阅读APP看书,第一时间看更新

2.4 云计算与大数据

2.4.1 云计算与大数据的关系

本质上,云计算与大数据的关系是静与动的关系。云计算强调的是计算,这是动的概念;而数据则是计算的对象,是静的概念。如果结合实际的应用,前者强调的是计算能力,后者看中的是存储能力。但是这样说,并不意味着两个概念就如此泾渭分明。大数据需要处理大数据的能力,其实就是强大的计算能力;另一方面,云计算的动也是相对而言的,如基础设施即服务中的存储设备提供的主要是数据存储能力,所以可谓是动中有静。如果数据是财富,那么大数据就是宝藏,而云计算就是挖掘和利用宝藏的利器。

从技术上来看,大数据和云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术等。

从应用角度上讲,云计算给大数据提供信息化的基础设施,能更有效利用资源;从产业发展的角度上讲,运用云平台,每天可以处理大批量的数据,并对这些数据进行科学、快速、智能的检索。

随着云时代的来临,大数据的关注度也越来越高,分析师团队认为大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百甚至数千台的计算机分配工作。大数据需要特殊的技术以有效地处理大量的数据。适用于大数据的技术,都是和云平台与云计算分不开的。

整合是云计算的主要功能,无论采取何种数据分析模型或运算方式,它都是通过将海量的服务器资源通过网络进行整合,以整理出有效的数据信息,并将其分配给各个目标用户,从而解决用户因存储资源不足所带来的问题。大数据则是数据爆发式增长所带来的一个全新的研究领域,对于大数据的研究,主要集中在如何对其进行存储和有效的分析,大数据主要是依靠云计算技术来进行存储和计算的。

2.4.2 云计算与大数据的结合

近些年,数字地球、数字城市、物联网、智慧城市不断演绎信息化建设的一个又一个高潮。云计算、大数据、人工智能成为现代商业的基础。云计算与大数据的融合发展已经成为必然的趋势。

云计算和大数据的融合发展将带来一次革命,无论对社会还是个人来说,都是一次世界观的改变。互联网不再是一个展示公司的工具和平台,而是属于未来的生产方式,是关乎竞争和生存的关键。就像在工业经济时代,人们无法拒绝用电;在个人计算机时代,人们无法拒绝用计算机办公;大数据与云计算的结合带来的是竞争形态的改变,当你的客户在互联网上,你的市场就在互联网上,如果缺乏对客户数据的分析和判断、对市场的了解,缺少的就是核心竞争力。政府和个人也一样,需要拥抱大数据时代的来临。

1.云计算对于大数据处理的作用

(1)云计算是大数据分析的前提

进入信息化时代之后,数据量在不断地增长,大部分企业都能通过大数据获得额外收益。在大数据分析的过程中,如果提取、处理和利用数据的成本超出了数据价值本身,那大数据分析也就没有了利用价值,功能越强大的云计算能力,就越能降低数据提取过程中的成本。

(2)云计算能够过滤无用信息

对于大数据系统收集的所有数据来说,大部分数据都是没有利用价值的,因此需要过滤出能为企业提供经济效益的可用数据。云计算可以提供按需拓展的存储资源,可以用来过滤掉无用的数据,是处理外部网络数据的最佳选择。

(3)云计算助力企业虚拟化建设

企业引入云计算系统,可以用信息来指导决策,通过将服务软件应用于云平台,还可将数据转化到企业现有系统中,帮助企业强化管理模式。上升到我国互联网整体发展层面,云计算与企业相结合将使得大数据分析变得更加简单,也成为推动企业虚拟化建设的重要手段,将使企业在全球市场更具竞争力。

2.大数据和云计算未来的发展方向和趋势

虽然大数据目前在国内还处于初级阶段,但是其商业价值已经显现出来。未来,数据可能成为最大的交易商品。但数据量大并不能算是大数据,大数据的特征是数据量大、数据种类多、非标准化数据的价值最大化。因此,大数据的价值是通过数据共享、交叉复用后获取最大的数据价值。未来大数据将会如基础设施一样,有数据提供方、管理者、监管者,数据的交叉复用将大数据变成一大产业。

随着大数据的发展,数据共享联盟将逐渐壮大成为产业的核心一环。但随着大数据的共享度越来越高,隐私信息泄露问题也随之而来,如每天手机产生的通话、位置等信息。

大数据在国家、企业及社会层面成为重要的战略资源,成为新的战略制高点和抢购的新焦点。

总之,未来云计算产业和大数据产业将呈现规模化发展趋势,市场红利可观,创新、服务、合作、技术将推动互联网科技企业站得更高、走得更远。

2.4.3 云计算的应用

云计算将在IT产业各个方面都有其用武之地,以下是云计算的10个比较典型的应用场景。

1.IDC云

IDC云是在IDC(Internet Data Center,互联网数据中心)原有数据中心的基础上,加入更多云的基因,如系统虚拟化技术、自动化管理技术和智慧的能源监控技术等。通过IDC的云平台,用户能够使用到虚拟机和存储等资源。此外,IDC可通过引入新的云技术来提供许多新的具有一定附加值的服务,如PaaS等。现在已成型的IDC云有Linode和Rackspace等。

2.企业云

企业云对于那些需要提升内部数据中心的运维水平和希望能使整个IT服务围绕业务展开的大中型企业都非常适合。相关的产品和解决方案有IBM的WebSphere CloudBurst Appliance、Cisco的UCS和VMware的vSphere等。

3.云存储系统

云存储系统可以解决本地存储在管理上的缺失并降低数据的丢失率,它通过整合网络中多种存储设备来对外提供云存储服务,并能管理数据的存储、备份、复制和存档,云存储系统非常适合那些需要存储和管理海量数据的企业。

4.虚拟桌面云

虚拟桌面云可以解决传统桌面系统高成本的问题,其利用了现在成熟的桌面虚拟化技术,更加稳定和灵活,而且系统管理员可以统一地管理用户在服务器端的桌面环境。该技术比较适合那些需要使用大量桌面系统的企业。图2-4所示为虚拟桌面云的架构。

图2-4 虚拟桌面云的架构

5.开发测试云

开发测试云可以解决开发测试过程中的棘手问题,其通过友好的Web界面,可以预约、部署、管理和回收整个开发测试的环境,通过预先配置好的虚拟镜像(包括操作系统、中间件和开发测试软件)来快速地构建一个个异构的开发测试环境,通过快速备份/恢复等虚拟化技术来重现问题,并利用云的强大的计算能力来对应用进行压力测试,比较适合那些需要开发和测试多种应用的组织和企业。

6.大规模数据处理云

大规模数据处理云能对海量的数据进行大规模的处理,可以帮助企业快速进行数据分析,发现可能存在的商机和存在的问题,从而做出更好、更快和更全面的决策。其工作过程是大规模数据处理云通过将数据处理软件和服务运行在云计算平台上,利用云计算的计算能力和存储能力对海量的数据进行大规模的处理。

7.协作云

协作云是云供应商在IDC云的基础上或者直接构建一个专属的云,并在这个云搭建整套的协作软件,并将这些软件共享给用户,非常适合那些需要一定的协作工具,但不希望维护相关的软硬件和支付高昂的软件许可证费用的企业与个人。

8.游戏云

游戏云是将游戏部署至云中的技术,目前主要有两种应用模式,一种是基于Web的游戏模式,如使用JavaScript、Flash和Silverlight等技术,并将这些游戏部署到云中,这种解决方案比较适合休闲游戏;另一种是为大容量和高画质的专业游戏设计的模式,整个游戏都将在云中运行,但会将最新生成的画面传至客户端,比较适合专业玩家。

9.HPC云

HPC(High Performance Computing,高性能计算)云能够为用户提供可以完全定制的高性能计算环境,用户可以根据自己的需求来改变计算环境的操作系统、软件版本和节点规模,从而避免与其他用户的冲突,并可以成为网格计算的支撑平台,以提升计算的灵活性和便捷性。HPC云特别适合需要使用高性能计算,但缺乏巨资投入的普通企业和学校。

10.云杀毒

云杀毒技术可以在云中安装附带庞大病毒特征库的杀毒软件,当发现有嫌疑的数据时,杀毒软件可以将有嫌疑的数据上传至云中,并通过云中庞大的特征库和强大的处理能力来分析这个数据是否含有病毒。这非常适合那些需要使用杀毒软件来捍卫其计算机安全的用户。