1.4 物联网与云技术
云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、存储、处理和共享的一种托管技术。
云技术(Cloud Technology)是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需使用,灵活便利。
【知识链接1.2】 最著名的云计算例子——亚马逊的EC2网格
亚马逊弹性计算云(Elastic Compute Cloud,EC2)是一个让使用者可以租用云端电脑运行所需应用的系统。EC2借由提供Web服务的方式让使用者可以弹性地运行自己的Amazon机器映像档,使用者可以在这个虚拟机器上运行任何自己想要的软件或应用程序。它提供可调整的云计算能力,旨在使开发者的网络规模计算变得更加容易。
《纽约时报》租用了这个网格创建了数据容量达4TB的PDF文件库,包含了从1851-1920年之间纽约时报发表的1100万篇文章。
据《纽约时报》的Derek Gottfrid说,他使用了100个亚马逊的EC2实例和一个Hadoop应用程序,在不到24小时的时间里就编排完成了全部的1100万篇文章,并且生成了另外1.5TB数据,累计用了240美元。
即使云计算没有作为一项主流的服务应用,但是它能提供这种难得的处理能力也是一种可行的选择。
云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高速发展和应用,将来每个商品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后台支撑,这只能通过云计算来实现。
最简单的云计算技术在网络服务中已经随处可见,如搜寻引擎、网络信箱等,使用者只要输入简单指令即能得到大量信息。
未来如手机、GPS等都可以通过云计算技术发展出更多的应用服务。未来的云计算不仅能实现资料搜寻、分析的功能,像分析DNA结构、基因图定序、解析癌症细胞等工作也可以通过这项技术轻易完成。
云技术的一个发展方向是将实验室中的云计算理论与半成熟的理论(如软件即服务或面向服务架构等)结合起来,将企业应用和功能置于云中。例如,与其将一些已经成熟的服务(如电邮服务)加入云应用中,不如想象一下,将企业的供应链系统加入云应用中,实现与供应商的实时链接。从逻辑上讲,企业可以将业务流程和功能分割成小的功能块,并将其与云技术结合,从而创造出个性化的业务功能,同时将原先一两年才能完成的架构搭建工作缩短到数周或数月完成。
1.4.1 云计算技术
2006年,27岁的Google高级工程师克里斯托夫·比希利亚第一次向Google董事长兼CEO施密特提出“云计算”的想法,在施密特的支持下,Google推出了“Google 101计划”,并正式提出“云”的概念,由此拉开了一个计算技术及商业模式的变革。
Google的云计算概念是一个形象的说法,包含两个层次的含义:一是商业层面,即“云”;一个是技术层面,即“计算”。把云和计算相结合,用来说明Google在商业模式和计算架构上与传统的软件和硬件公司的不同。
云计算(Cloud Computing)是分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。同时,云计算是一个很时尚的概念,它既不是一种技术,也不是一种理论,而是一种商业模式的体现方式。
“云计算”代表了一个时代需求,反映了市场关系的变化,拥有了更为庞大的数据规模,就可以提供更广更深的信息服务,而软件和硬件影响相对缩小。
【应用案例1.1】 云存储
在云计算出现之前,对于日常工作和生活的文件,通常采用移动硬盘、U盘等实物存储装置进行备份,因此使用时必须将存储装置随身携带,而且往往存储容量有限。
但云计算的出现彻底改变了这一格局:通过云计算服务提供商提供的云存储技术,只需要一个账户和密码,就可以在任何有互联网的地方对数据进行访问和使用,其便捷性远远优于移动硬盘。在成本方面,远远低于各类存储装置的价格,而且更具灵活性,不但摆脱了办公地点等空间、地域的限制,而且在一定程度上也摆脱了存储容量的限制。
云计算是一个新领域,使用了与Linux、高性能计算和虚拟化等有关的技术,对于IBM和惠普等公司来说,大型计算机的复苏和服务器的发展以及数据中心在能力、数据和处理器利用率方面的效率已经使云计算成为现实。
【应用案例1.2】 云“决策”
在GPS被广泛应用之前,如果到一个陌生的地方出差或者旅游,那么必须准备一张最新版的当地地图,否则将寸步难行。即使有了地图,有时也需要拿着地图进行问路和确认。
GPS的出现,改变了出行的效率和规划:只需要有智能手机和网络,便可以拥有最新版的全世界地图。在拥有智慧交通的城市中,还可以通过地图获得最佳的出行路线和解决方案,如获取实时的交通路况、天气状况等。
正是基于云计算技术的GPS,把这一切变为了可能。所有的服务,均存储在服务提供商的“云”中,通过手机终端便可以访问相关的信息,从而为访问者提供决策方案。
1.4.1.1 云计算的关键技术
云计算实际上包含多种技术,如软件即服务(SaaS)和硬件即服务(HaaS)。软件即服务是Salesforce公司提出的一种发布软件的新方式,而硬件即服务则是亚马逊和其他公司推出的通过网络提供存储和计算能力的新方式。
云计算系统的平台管理技术能够使大量的服务器协同工作,方便进行业务部署和开通,快速发现和恢复系统故障,通过自动化、智能化的手段实现大规模系统的可靠运营。
云计算系统核心技术为并行计算,并行计算是指同时使用多种计算资源解决计算问题的过程。通过并行计算集群完成数据的处理,再将处理的结果返回给用户。
1. 虚拟化技术
虚拟化技术是指计算元件在虚拟的基础上而不是真实的基础上运行,它可以扩大硬件的容量,简化软件的重新配置过程,减少软件虚拟机相关开销和支持更广泛的操作系统。
通过虚拟化技术可实现软件应用与底层硬件相隔离,包括将单个资源划分成多个虚拟资源的分裂模式,也包括将多个资源整合成一个虚拟资源的聚合模式。虚拟化技术根据对象可分成存储虚拟化、计算虚拟化、网络虚拟化等,计算虚拟化又分为系统级虚拟化、应用级虚拟化和桌面虚拟化等。
在云计算实现中,系统虚拟化是一切建立在“云”上的服务与应用的基础。虚拟化技术主要应用在CPU、操作系统、服务器等方面,是提高服务效率的最佳解决方案。
2. 分布式海量数据存储
云计算系统由大量服务器组成,同时为大量用户服务,因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式(集群计算、数据冗余和分布式存储)保证数据的可靠性。冗余存储的方式通过任务分解和集群,用低配机器替代超级计算机的性能来保证低成本,这种方式保证分布式数据的高可用、高可靠和经济性,即同一份数据存储多个副本。
云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS。
3. 海量数据管理技术
由于云计算需要对分布的、海量的数据进行处理、分析,因此数据管理技术必需能够高效地管理大量的数据。
云计算系统中的数据管理技术主要是Google的BigTable数据管理技术和Hadoop团队开发的开源数据管理模块HBase。由于云数据存储管理形式不同于传统的RDBMS数据管理方式,如何在规模巨大的分布式数据中找到特定的数据,也是云计算数据管理技术所必须解决的问题。同时,由于管理形式的不同造成传统的SQL数据库接口无法直接移植到云数据管理系统中,因此研究关注于为云数据管理提供RDBMS和SQL的接口,如基于Hadoop子项目HBase和Hive等。
另外,在云数据管理方面,如何保证数据安全性和数据访问高效性也是研究关注的重点问题之一。
4. 编程方式
云计算提供了分布式的计算模式,客观上要求必须有分布式的编程模式。
云计算采用了一种思想简洁的分布式并行编程模型Map-Reduce。Map-Reduce是一种编程模型和任务调度模型,主要用于数据集的并行运算和并行任务的调度处理。在该模式下,用户只需要自行编写Map函数和Reduce函数即可进行并行计算。其中,Map函数定义各节点上的分块数据的处理方法,Reduce函数定义中间结果的保存方法以及最终结果的归纳方法。
5. 云计算平台管理技术
云计算资源规模庞大,服务器数量众多并分布在不同的地点,同时运行着数百种应用,如何有效地管理这些服务器,保证整个系统提供不间断的服务是巨大的挑战。
1.4.1.2 云技术的现状
同许多技术创新一样,云计算的应用遇到了传统的系统和设想的阻碍。
尽管云计算能够提供节省成本的好处,但是其在新兴市场的应用将超过在欧洲或者美洲市场的应用。由于各地区发展的程度和地域的差异,因此差别较大。各地区的云技术发展现状对比如表1.15所示。
表1.15 各地区的云技术发展现状对比
不过,IBM已经在中国、南非和越南等国家建立了云计算中心,使得当地的个人、团体和企业能够立即访问以前无法接触到的应用程序。
同云计算、网络计算和/或公用计算的其他实例一样,这些中心以运行在大型计算机或者刀片式服务器上的虚拟化的Linux实例为基础,能够极大地促进这些中心所在地的经济。
云计算的概念也许对于IT经理是有魅力的,但是像许多颠覆当前做事方法的想法一样,云计算也存在一些阻力,如隐私和控制的问题。不过,云计算的价值在于它使用户回到了大型计算机的世界,无论用户使用的是移动电脑还是掌上电脑,其计算能力都远远超过三四十年前的大型计算机。
对于企业而言,如亚马逊、Salesforce、IBM、甲骨文和微软等,为用户提供网络存储和软件等服务,帮助它们进行客户关系管理。
1.4.1.3 云技术的应用
1. 云计算与物联网
云计算和物联网之间的关系可以用一个形象的比喻来说明:“云计算”是“互联网”中的神经系统的雏形,“物联网”是“互联网”正在出现的末梢神经系统的萌芽。
【应用案例1.3】 人与车“互动”的车联网
车联网的概念源于物联网,即车辆物联网,是以行驶中的车辆为信息感知对象,借助新一代信息通信技术,实现车与X(即车与车、人、路、服务平台)之间的网络连接,提升车辆整体的智能驾驶水平,为用户提供安全、舒适、智能、高效的驾驶感受与交通服务,同时提高交通运行效率,提升社会交通服务的智能化水平。
在车联网中,通过各种传感器及设备,可以实现如下的人与车互动:
(1)采集并分析司机的驾驶习惯,实时监测车辆各零部件如轮胎、刹车片、空调等状态。
(2)提供实时交通路况,供司机决策。
(3)适时给司机提供驾驶建议。
(4)可以将上述数据和保险公司数据库结合,提供最合适的保险计划。
2. 云安全
云安全(Cloud Security)是一个从“云计算”演变而来的新名词。云安全的策略构想是:使用者越多,每个使用者就越安全,因为如此庞大的用户群,足以覆盖互联网的每个角落,只要某个网站被挂马或某个新木马病毒出现,就会立刻被截获。
“云安全”通过网状的大量客户端对网络中软件行为的异常进行监测,获取互联网中木马、恶意程序的最新信息,推送到Server端进行自动分析和处理,再把病毒和木马的解决方案分发到每一个客户端。
3. 云存储应用
云存储是在云计算概念上延伸和发展出来的一个新概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。
当云计算系统运算和处理的核心是大量数据的存储和管理时,云计算系统中就需要配置大量的存储设备,那么云计算系统就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云计算系统。
4. 云呼叫应用
云呼叫中心是基于云计算技术而搭建的呼叫中心系统,企业无须购买任何软硬件系统,只需具备人员、场地等基本条件,就可以快速拥有属于自己的呼叫中心,软硬件平台、通信资源、日常维护与服务由服务器商提供。
云呼叫系统具有建设周期短、投入少、风险低、部署灵活、系统容量伸缩性强、运营维护成本低等众多特点;无论是电话营销中心还是客户服务中心,企业只需按需租用服务,便可建立一套功能全面、稳定、可靠、座席可分布全国各地、全国呼叫接入的呼叫中心系统。
5. 私有云应用
私有云(Private Cloud)是将云基础设施与软硬件资源创建在防火墙内,为机构或企业内各部门提供共享数据中心内的资源。
私有云计算同样包含云硬件、云平台、云服务三个层次。
6. 云游戏应用
云游戏是以云计算为基础的游戏方式,在云游戏的运行模式下,所有游戏都在服务器端运行,并将渲染后的游戏画面压缩后通过网络传送给用户。在客户端,用户的游戏设备不需要任何高端处理器和显卡,只需要基本的视频解压能力就可以了。
7. 云教育应用
视频云计算应用在教育行业的实例:流媒体平台采用分布式架构部署,分为Web服务器、数据库服务器、直播服务器和流服务器,如有必要可在信息中心架设采集工作站、搭建网络电视或实况直播应用,在各个学校已经部署录播系统或直播系统的教室配置流媒体功能组件,这样录播实况可以实时传送到流媒体平台管理中心的全局直播服务器上,同时录播的学校也可以上传到信息中心的流存储服务器上,方便今后的检索、点播、评估等各种应用。
8. 云会议应用
云会议是基于云计算技术的一种高效、便捷、低成本的会议形式。使用者只需要通过互联网界面,进行简单易用的操作,便可快速高效地与全球各地团队及客户同步分享语音、数据文件及视频,而会议中数据的传输、处理等复杂技术由云会议服务商帮助使用者进行操作。
目前,国内云会议主要集中在以SaaS模式为主体的服务内容,包括电话、网络、视频等服务形式,基于云计算的视频会议就叫云会议。云会议是视频会议与云计算的完美结合,带来了最便捷的远程会议体验。及时语移动云电话会议是云计算技术与移动互联网技术的完美融合,通过移动终端进行简单的操作,随时随地高效地召集和管理会议。
9. 云社交应用
云社交(Cloud Social)是一种物联网、云计算和移动互联网交互应用的虚拟社交应用模式,以建立著名的“资源分享关系图谱”为目的,进而开展网络社交。云社交的主要特征就是把大量的社会资源统一整合和评测,构成一个资源有效池向用户按需提供服务。参与分享的用户越多,创造的价值就越大。
1.4.2 云计算与大数据
从技术上来看,大数据和云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。大数据的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
随着云时代的来临,大数据的关注度也越来越高。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要向数十、数百或甚至数千的电脑分配工作。大数据需要特殊的技术,以有效地处理在指定时间范围内可承受的大量数据。适用于大数据的技术,包括大规模的并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
【应用案例1.4】 疫情期间的通行证——大数据行程卡
通信大数据行程卡,是由中国信通院联合中国电信、中国移动、中国联通三家基础电信企业利用手机“信令数据”,通过用户手机所处的基站位置获取,为全国16亿手机用户免费提供的查询服务。手机用户可通过服务,查询本人前14天到过的所有地市信息,包括长途自驾、乘坐火车时途经的地点等。
在2020年疫情最为严重的阶段,截至2020年3月25日,累计查询量已超过4.5亿次。
整合是云计算的主要功能,无论采取何种数据分析模型或运算方式,它都是通过将海量的服务器资源通过网络进行整合,以整理出有效的数据信息,并将其分配给各个目标客户,从而解决用户因存储资源不足所带来的问题。大数据则是数据爆发式增长所带来的一个全新的研究领域,对于大数据的研究,主要集中在如何对其进行存储和有效的分析,大数据是依靠云计算技术进行存储和计算的。
1. 云计算与大数据的联系
云计算与大数据的联系如表1.16所示。
表1.16 云计算与大数据的联系
2. 云计算与大数据的区别
云计算与大数据的区别如图1.28所示。
图1.28 云计算与大数据的区别
可以这样来理解:云计算技术就是一个容器,大数据则是存放在这个容器中的水,大数据是要依靠云计算技术进行存储和计算的。因此,云计算是硬件资源的虚拟化,而大数据是海量数据的高效处理。
从工作原理的角度观察:云计算相当于计算机和操作系统,将大量的硬件资源虚拟化后再进行分配使用。
可以说,大数据相当于海量数据的“数据库”。通过大数据领域的发展也可以看出,当前的大数据发展一直在向着近似于传统数据库体验的方向发展。简言之,传统数据库给大数据的发展提供了足够大的空间。
大数据的总体架构包括三层:数据存储、数据处理和数据分析。
数据首先要通过存储层存储下来,其次根据数据需求和目标来建立相应的数据模型和数据分析指标体系,最后对数据进行分析进而产生价值。而中间的时效性又通过中间数据处理层提供的强大的并行计算和分布式计算能力来完成。三者相互配合,这让大数据产生最终价值。
1.4.3 云服务
云服务(Cloud Serving),是基于互联网相关服务的增加、使用和交互模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。
云是网络、互联网的一种比喻说法。云服务指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关的,也可以是其他服务。它意味着计算能力也可作为一种商品通过互联网进行流通。
1.4.3.1 市场
从云计算的服务模式上看,个人云的诞生其实是整个云计算服务整体的一个延伸,个人云服务领域必将得以不断拓展,其市场价值也会得到凸显。
2020年7月29日,中国信通院发布《云计算白皮书(2020年)》,这是中国信通院第6次发布云计算白皮书。白皮书提到,云计算自2006年提出至今,大致经历了形成阶段、发展阶段和应用阶段。过去十年是云计算突飞猛进的十年,全球云计算市场规模增长数倍,我国云计算市场从最初的十几亿增长到现在的千亿规模,各国政府纷纷推出“云优先”策略,我国云计算政策环境日趋完善,云计算技术不断发展成熟,云计算应用从互联网行业向政务、金融、工业、医疗等传统行业加速渗透。
近几年,全球云计算市场保持稳定增长态势。2019年,以IaaS、PaaS和SaaS为代表的全球云计算市场规模达到1883亿美元,增速达20.86%。预计未来几年,市场平均增长率在18%左右,到2023年市场规模将超过3500亿美元,如图1.29所示。
图1.29 全球云计算市场规模及发展趋势
(资料来源:Gartner,中国信通院。)
1.4.3.2 形式
简单来说,云服务可以将企业所需的软硬件、资料都放到网络上,在任何时间、地点,使用不同的IT设备互相连接,实现数据存取、运算等目的。当前,常见的云服务有公共云(Public Cloud)与私有云(Private Cloud)两种。
1. 公共云成本较低
公共云是最基础的服务,多个客户可共享一个服务提供商的系统资源,他们无须架设任何设备及配备管理人员,便可享有专业的IT服务,这对于一般创业者、中小企来说,无疑是一个降低成本的好方法。公共云还可细分为以下3类:
(1)Software-as-a-Service,SaaS(软件即服务)。
(2)Platform-as-a-Service,PaaS(平台即服务)。
(3)Infrastructure-as-a-Service,IaaS(基础设施即服务)。
平日常用的Gmail、Hotmail、网上相册都属于SaaS,主要以单一网络软件为主导;至于PaaS则以服务形式提供应用开发、部署平台,加快用户自行编写CRM(客户关系管理)、ERP(企业资源规划)等系统的功能,用户必须具备丰富的IT知识。
2. IaaS满足企业不同需要
上述公共云服务成本较低,但使用灵活度不足,不满足这种服务模式的中小企业,不妨考虑IaaS的IT资源管理模式。
IaaS架构主要通过虚拟化技术与云服务结合,直接提升整个IT系统的运作能力,当前的IaaS服务提供商,如第一线安莱公司,会以月费形式提供具有顶尖技术的软硬件及服务,如服务器、存储系统、网络硬件、虚拟化软件等。IaaS让企业可以自由选择使用哪些软硬件及服务,中小企业可根据行业的需要、发展规模,建设最适合自己的IT系统。
这种服务模式能为中小企业带来多重优势:
(1)企业不必配备花费庞大的IT基建设备,却可享受同样专业的服务。
(2)管理层可根据业务发展的规模、需求,调配所需的服务组合。
(3)当有新技术出现时,企业可随时向服务提供商提出升级要求,不必为增加硬件而烦恼。
(4)IaaS服务提供商拥有专业的顾问团队,中小企业可免除系统管理、IT支持方面的支出。
3. 大企业倾向架设私有云
近年来,市场竞争不断加剧,就算大型企业也关注成本的节约,因而也需要云服务。虽然公共云服务提供商需遵守行业法规,但是大企业(如金融、保险行业)为了兼顾行业、客户私隐,不可能将重要数据存放到公共网络上,故倾向于架设私有云端网络。
私有云的运作形式与公共云类似。然而,架设私有云却是一项重大投资,企业需自行设计数据中心、网络、存储设备,并且要有专业的顾问团队。企业管理层必须充分考虑使用私有云的必要性,以及是否拥有足够资源来确保私有云正常运作。
4. IaaS:基础设施即服务
消费者通过Internet可以从完善的计算机基础设施获得服务。
5. SaaS:软件即服务
它是一种通过Internet提供软件的模式,用户无须购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。
6. PaaS:平台即服务
PaaS实际上是指将软件研发的平台作为一种服务,以SaaS的模式提交给用户。因此,PaaS也是SaaS模式的一种应用。但是,PaaS的出现可以加快SaaS的发展,尤其是加快SaaS应用的开发速度。
7. 按需计算
顾名思义,按需(On-Demand)计算将计算机资源(处理能力、存储等)打包成类似公共设施的可计量的服务。在这一模式中,客户只需为他们所需的处理能力和存储支付费用。
按需计算服务的客户端基本上将这些服务作为异地虚拟服务器来使用。无须投资自己的物理基础设施,公司与云服务提供商之间执行现用现付的方案。
按需计算本身并不是一个新概念,但它因云计算而获得新生。在过去的岁月里,按需计算由一台服务器通过某种分时方式来提供。
1.4.3.3 相关问题
当前云服务存在的问题及详细描述如表1.17所示。
表1.17 当前云服务存在的问题及详细描述
1.4.3.4 优势和不足
云开发的优势之一就是规模经济。
利用云计算供应商提供的基础设施,同在单一的企业内开发相比,开发者能够得到更好、更便宜和更可靠的应用。如果需要,该应用就能够利用云的全部资源而无须企业投资类似的物理资源。
关于成本,由于云服务遵循一对多的模式,与单独的桌面程序部署相比,成本极大地降低了。云应用通常是租用的,以每个用户为基础计价,而不是购买或许可软件程序(每个桌面一个)的物理复制。它更像是订阅模型而不是资产购买(和随之而来的贬值)模型,这意味着更少的前期投资和一个更可预知的月度业务费用流。
例如:部门喜欢云应用是因为所有的管理活动都经由一个中央位置而不是从单独的站点或工作站来管理。这使得员工能够通过Web进行远程访问应用。其他的好处包括用需要的软件可快速装备用户(称为快速供应),当有更多的用户导致系统重负时可添加更多计算资源(自动扩展)。当需要更多的存储空间或带宽时,公司只需要从云中添加另外一个虚拟服务器即可。这比自己的数据中心购买、安装和配置一个新的服务器容易得多。
对开发者而言,升级一个云应用比传统的桌面软件更容易,只需要升级集中的应用程序,应用特征就能快速顺利地得到更新,而不必手工升级组织内的每台计算机。有了云服务,一个改变就能影响运行应用的每一个用户,这大大降低了开发者的工作量。
云服务的不足之处及具体内容如表1.18所示。
表1.18 云服务的不足之处及具体内容