上QQ阅读APP看书,第一时间看更新
第3章 集成方法
本章在梳理国内外相关研究的基础上,结合课题研究目标,提出了云计算环境下的信息资源的集成方法,并探讨了其基本特征、主要类型及关键技术。本章提出的云计算环境下的信息资源集成方法的主要创新点如下:
(1)从资源、碎片、标签3个不同层次提出了云计算环境下的信息资源集成方法。
•碎片层次。提出了碎片信息资源的集成算子:filter、union、groupByKey、join、reduceByKey、cartesian。
•资源层次。提出了碎片层次的集成方法:资源的URI标识、资源内部结构的定义、与其他资源关联关系的标识和序列化处理方案。
•标签层次。提出了标签层次的集成方法:资源(或碎片)的语义标签之间的集成方法。
(2)本章提出的集成方法具有弹性集成和惰性计算的特点,不仅避免了中间iRDD数据对象的I/O成本,而且确保了信息资源集成活动中的数据一致性。
(3)提出了一种数据驱动型信息资源的集成方法,改变了传统的目标驱动和模型驱动的信息资源集成方法。
(4)提出了信息资源集成与服务中的结果呈现方法——数据可视化和故事化描述。