云计算
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.4 网格计算与云计算

网格(Grid)是20世纪90年代中期发展起来的下一代互联网核心技术。网格技术的开创者Ian Foster 将之定义为“在动态、多机构参与的虚拟组织中协同共享资源和求解问题”[6]。网格是在网络基础之上,基于SOA,使用互操作、按需集成等技术手段,将分散在不同地理位置的资源虚拟成为一个有机整体,实现计算、存储、数据、软件和设备等资源的共享,从而大幅提高资源的利用率,使用户获得前所未有的计算和信息能力。

国际网格界致力于网格中间件、网格平台和网格应用建设。就网格中间件而言,国外著名的网格中间件有Globus Toolkit、UNICORE、Condor、gLite等,其中Globus Toolkit得到了广泛采纳。就网格平台而言,国际知名的网格平台有TeraGrid、EGEE、CoreGRID、D-Grid、ApGrid、Grid3、GIG 等。美国TeraGrid 是由美国国家科学基金会计划资助构建的超大规模开放的科学研究环境。TeraGrid 集成了高性能计算机、数据资源、工具和高端实验设施。目前TeraGrid 已经集成了超过每秒750万亿次计算能力、30PB 数据,拥有超过100个面向多种领域的网格应用环境。欧盟e-Science 促成网格EGEE (Enabling Grids for E-sciencE),是另一个超大型、面向多种领域的网格计算基础设施。目前已有120多个机构参与,包括分布在48个国家的250个网格站点、68000个CPU、20PB数据资源,拥有8000个用户,每天平均处理30000个作业,峰值超过150000个作业。就网格应用而言,知名的网格应用系统数以百计,应用领域包括大气科学、林学、海洋科学、环境科学、生物信息学、医学、物理学、天体物理、地球科学、天文学、工程学、社会行为学等。

我国在十五期间有863支持的中国国家网格(CNGrid,863-10主题)和中国空间信息网格(SIG,863-13主题)、教育部支持的中国教育科研网格(ChinaGrid)、上海市支持的上海网格(ShanghaiGrid)等。中国国家网格拥有包括香港地区在内的10个节点,聚合计算能力为每秒18万亿次,目前拥有408个用户和360个应用。中国教育科研网格ChinaGrid连接了20所高校的计算设施,运算能力达每秒3万亿次以上,开发并实现了生物信息、流体力学等五个科学研究领域的网格典型应用。十一五期间,国家对网格支持的力度更大,通过973和863、自然科学基金等途径对网格技术进行了大力支持。973计划有“语义网格的基础理论、模型与方法研究”等,863计划有“高效能计算机及网格服务环境”、“网格地理信息系统软件及其重大应用”等,国家自然科学基金重大研究计划有“网络计算应用支撑中间件”等项目。

就像云计算可以分为IaaS、PaaS和SaaS三种类型一样,网格计算也可以分为三种类型:计算网格、信息网格和知识网格[6]。计算网格的目标是提供集成各种计算资源的、虚拟化的计算基础设施。信息网格的目标是提供一体化的智能信息处理平台,集成各种信息系统和信息资源,消除信息孤岛,使得用户能按需获取集成后的精确信息,即服务点播(Service on Demand)和一步到位的服务(One Click is Enough)。知识网格[8]研究一体化的智能知识处理和理解平台,使得用户能方便地发布、处理和获取知识。

需要说明的是,目前大家对网格的认识存在一种误解,认为只有使用Globus Toolkit 等知名网格中间件的应用才是网格。我们认为,只要是遵照网格理念,将一定范围内分布的异构资源集成为有机整体,提供资源共享和协同工作服务的平台,均可以认为是网格。这是因为,由于网格技术非常复杂,必然有一个从不规范到规范化的过程,应该承认差异存在的客观性。虽然网格界从一开始就致力于构造能够实现全面互操作的环境,但由于网格处于信息技术前沿、许多领域尚未定型、已发布的个别规范过于复杂造成易用性差等原因,现有网格系统多针对具体应用采用适用的、个性化的框架设计和实现技术等,造成网格系统之间互操作困难,这也是开放网格论坛OGF (Open Grid Forum)提出建立不同网格系统互通机制计划GIN (Grid Interoperation Now)的原因。从另一个角度看,虽然建立全球统一的网格平台还有很长的路要走,但并不妨碍网格技术在各种具体的应用系统中发挥重要的作用。

网格计算与云计算的关系如表1-1所示。

表1-1 网格计算与云计算的比较

网格计算在概念上争论多年,在体系结构上有三次大的改变,在标准规范上花费了大量的人力,所设定的目标又非常远大——要在跨平台、跨组织、跨信任域的极其复杂的异构环境中共享资源和协同解决问题,所要共享的资源也是五花八门——从高性能计算机、数据库、设备到软件,甚至知识。云计算暂时不管概念、不管标准,Google 云计算与亚马逊云计算的差别非常大,云计算只是对它们以前所做事情新的共同的时髦叫法,所共享的存储和计算资源暂时仅限于某个企业内部,省去了许多跨组织协调的问题。以Google为代表的云计算在内部管理运作方式上的简洁一如其界面,能省的功能都省略,Google文件系统(GFS)甚至不允许修改已经存在的文件,只允许在文件后追加数据,大大降低了实现难度,而且借助其无与伦比的规模效应释放了前所未有的能量。

网格计算与云计算的关系,就像是OSI 与TCP/IP 之间的关系:国际标准化组织(ISO)制定的OSI(开放系统互联)网络标准,考虑得非常周到,也异常复杂,在多年之前就考虑到了会话层和表示层的问题。虽然很有远见,但过于理想,实现的难度和代价非常大。当OSI 的一个简化版——TCP/IP 诞生之后,将七层协议简化为四层,内容也大大精简,因而迅速取得了成功。在TCP/IP 一统天下之后多年,语义网等问题才被提上议事日程,开始为TCP/IP 补课,增加其会话和表示的能力。因此,可以说OSI 是学院派,TCP/IP是现实派;OSI是TCP/IP的基础,TCP/IP又推动了OSI的发展。两者不是“成者为王、败者为寇”,而是滚动发展。

没有网格计算打下的基础,云计算也不会这么快到来。云计算是网格计算的一种简化实用版,通常意义的网格是指以前实现的以科学研究为主的网格,非常重视标准规范,也非常复杂,但缺乏成功的商业模式。云计算是网格计算的一种简化形态,云计算的成功也是网格的成功。网格不仅要集成异构资源,还要解决许多非技术的协调问题,也不像云计算有成功的商业模式推动,所以实现起来要比云计算难度大很多。但对于许多高端科学或军事应用而言,云计算是无法满足需求的,必须依靠网格来解决。

目前,许多人声称网格计算失败了,云计算取而代之了,这其实是一种错觉。网格计算已经有十多年历史,不如刚兴起时那样引人注目是正常的。事实上,有些政府主导、范围较窄、用途特定的网格,已经取得了决定性的胜利。代表性的有美国的TeraGrid和欧洲的EGEE等,这些网格每天都有几十万个作业在上面执行。未来的科学研究主战场,将建立在网格计算之上。在军事领域,美军的全球信息网格GIG 已经囊括超过700万台计算机,规模超过现有的所有云计算数据中心计算机总和。

相信不久的将来,建立在云计算之上的“商业2.0”与建立在网格计算之上的“科学2.0”都将取得成功。