1.2 信息资源集成
“信息资源集成”与“信息资源整合”是同义词,“集成”与“整合”均和英文单词Integration相对应。从国内学术界来看,“信息资源整合”的使用频率比“信息资源集成”高。“集成”意味着原有主体之间“协调”“协作”,可以从不同层次进行集成,如数据层、应用层、服务层等。“整合”更强调来源数据的“重新整理、序化、统一”,“集成”的意义比“整合”更广泛一些,但是国内学者还未对“集成”与“整合”的区别进行探讨,所以在此研究综述中不对这两个词加以区别。
从2003年开始,国内信息资源整合的研究和讨论明显增加,CNKI全文数据库中的相关文献在2002年有24篇,到2007年达到236篇,在2008—2015年间发文量较为平稳,在240篇上下浮动,2016年后开始下滑。从研究领域看,国内相关研究主要分布在图书情报、政府、企业3个领域,其中图书情报领域的相关论文占44%,核心期刊更达到46%。
1. 信息资源集成(整合)概念的研究
领域不同,专业背景不同,不同学者对信息资源集成(整合)的理解也不同,大多是从自身的专业背景出发对信息资源集成(整合)做出理论阐述。面对众多的观点和理论,可从管理、技术和领域3个角度来把握信息资源集成(整合)的概念和内涵。
•管理角度。认为信息资源集成(整合)是一个将信息资源从部分到整体、从无序到有序、从零散到系统的管理活动,强调资源序化、系统构建的过程。例如,霍国庆认为,信息资源管理是一种集成的管理活动,信息资源管理实质上是各种信息活动或信息系统的整合过程。苏新宁等强调信息资源整合就是信息资源序化的过程,认为信息资源整合是将离散、多元、异构的信息资源组织为一个整体,使之有利于管理、利用和服务。与信息资源整合紧密相关,马文峰对数字信息资源整合进行阐述,指出其是数字资源优化组合的状态变化,是将相对独立的数字资源系统中的对象重新组合为一个新的有机整体,进而形成一个新的数字资源体系,这也强调了系统组织过程中的状态变化。
•技术角度。强调信息资源整合的技术及其实现过程,重视对集成成果的利用。例如,黄晓斌等认为,信息资源整合是利用集成技术将自主、分布、异构的数字资源集成在一起,搭建一个统一、易用的信息资源利用环境供用户使用。邹嘉麟等从信息生命周期理论出发,认为Web信息资源整合是对Web上的特定信息源进行生命周期管理的过程,并在此基础上实现高效的比较、查询和检索。而对于信息资源整合的内容,主要从两方面进行阐述:一是信息活动流程层面,整合是对于加工活动及流程的重新组合;二是信息内容层面,例如不同载体信息、相同载体信息之间的重新组合等,涵盖了数据、内容和应用3个具体方面的整合。
•领域角度。从自身领域的实际需要出发,阐述信息资源集成(整合)的内涵。例如,徐瑞鸿从档案资源整合的角度出发,强调信息资源整合是进行二次开发利用的过程,通过对信息资源进行重新组织、深度加工,从而创造出新的知识。尚武则从图书馆领域出发,认为信息资源整合是根据用户的需求进行不同层次、不同深度、不同方式的整合加工,其目的是使信息资源增值并以信息产品的形式提供给用户。赵冬梅也对图书馆信息资源整合的含义进行了阐述,指出图书馆信息资源整合是在一定的规范标准指导下,将图书馆范围内多种载体类型、分散、异构的信息资源有机结合,从而融合图书馆内所有资源分类、编目、流通工作,目的是在统一的数据存取模式和统一的用户界面下提供对各种类型资源的检索、使用等服务。
无论是从管理角度,还是从技术角度或领域角度,都不难发现,进行信息资源整合的目的都是一致的:使信息资源能得到有效利用,如实现统一检索、知识创造和信息服务等。而三者之间又具有紧密关联,管理角度从宏观上调控信息资源集成(整合),技术角度是信息资源整合得以实现的基石,而领域角度则对其具体应用和存在意义进行较为完善的阐述。
2. 信息资源整合的内容研究
国内对于信息资源集成(整合)方面的研究分布较为集中,主要包括图书情报、企业信息管理和政府信息管理3个领域,其研究内容随着研究领域的不同而呈现出差异性。
•图书情报领域。主要对信息资源管理的理论体系和通用模型、方法与技术进行研究。例如,王琳等将信息集成的层次分成两层,一是信息内容本身的集成,二是对信息资源主题检索点的集成,提出基于领域进行信息集成的范式。王善平通过分析已有的数字信息资源整合案例,论述了信息资源整合的重要性,并提出关键在于标准化,进而从3层标准出发提出如何进行数字信息资源整合。庞馨悦等阐述了信息资源整合与集成服务保障体系的必要性,通过实例分析了目前保障体系存在的问题,提出了完善保障体系的对策建议。胡昌平等从发展的角度将信息资源整合分为文献信息资源整合、数字信息资源整合和知识信息资源整合3个阶段。崔瑞琴等在探讨数字信息资源整合概念和特点的基础上,重点从基于机构信息资源的整合项目和基于内容的信息整合方式两个方面论述了数字信息资源整合的方式,并提出了应注意的问题。章成志等设计了自下而上为基础层、数据层、服务层到应用层的4层体系结构用于图书馆信息资源的整合。李凌志等在对传统信息集成技术的局限性进行分析的基础上,结合本体的特点,提出了本体在信息集成中应用的3种方法,并对国内外相关研究进行了详细介绍。刘萍也运用本体论和相关技术设计了信息资源集成的原型系统并达到实现层面。李广建等在对国外现有整合系统进行研究以后,分析了4种系统实现机制,包括数据仓库整合机制、代理整合机制、中介器封装器整合机制和P2P整合机制。胡昌平等着重个性化的信息服务,主要采用J2EE技术架构和B/S模式构建了个性化服务的信息资源整合平台。彭洁等构建了信息资源整合技术框架,分为4个层次:标准和规范层、基础设施层、数据管理层、整合平台层。
•政府信息管理领域。主要运用信息资源整合的理论和方法进行政府部门的业务的整合与优化。例如,吴占坤结合政府部门的实际工作,将政府信息资源集成(整合)主要分为3个层面:数据层面的整合、业务流程层面的整合和应用系统层面的整合。
•企业信息管理领域。注重运用信息资源整合的理论与思想解决企业业务问题,尤其是平台的搭建、业务模型的构建等。例如,刘玉照等通过引入信息集成,基于EAI技术,分析了企业信息集成与信息分享的问题。而齐国隆等利用SOA体系架构解决医疗信息集成问题。吕希艳等在分析企业信息资源整合存在的问题及挑战的基础上,主要讨论了如何利用SOA进行企业信息资源整合,分析了适用性、有效性与可行性,并提出了相应的建议。章峰等建立了基于XML的企业信息集成平台,使用XML对异构数据进行集成,以XML的文档形式存储数据。
3. 信息资源整合的应用研究
通过对文献的梳理,发现信息资源整合应用方面的研究主要集中在4个细分领域:
•电子政务信息资源整合。鲁俊杰等对面向信息资源整合的电子政务云平台进行了探索和设计。赵英等运用知识管理的理念、技术和方法实现跨部门政府信息资源的整合与共享。罗贤春等在分析已有整合模型的基础上,以个性化共享目录为出发点提出了构建什么样的电子政务信息资源整合模型,并在应用层面进行了相关分析。牛力等基于政务信息资源整合及共享研究的文献进行综述分析,对发展中的阻碍因素、资源整合与共享模式、技术实现方法及模型等进行了研究,并进一步对政务信息资源整合共享的发展方向作了展望。杨兴凯等对政府信息资源集成方法进行了回顾性研究,提出可以从信息资源集成的分布形式和异构信息资源的集成方法进行划分,而且指出了现有研究存在的不足。
•档案信息资源整合。张东华在对网络环境下档案信息资源及其服务特点变化进行分析的基础上,提出了进行档案信息资源整合的方法和步骤,并从意识理念、标准规范、法律保障等方面论述了档案信息资源整合的具体措施。而蒋冠以网络环境下档案信息资源整合的内涵、必要性等基本问题为出发点,探讨了其实现形式和目标取向,并进一步对瓶颈分析、实施策略、保障体系等具体实施环节进行了较为全面的论述。何军从数据仓库和信息集成技术两个方面出发,对档案信息资源的集成管理与集成模式进行了研究。王斌等则基于网络信息资源整合的研究成果,对档案网站信息资源整合的实施提出4种方法,分别设计了整合方案。牛力等通过引入云计算技术来解决档案资源共享问题,并提出了一种档案信息资源整合与服务模式。
•图书馆信息资源整合。张燕萍通过调查北京大学图书馆、清华大学图书馆、复旦大学图书馆等国内20所大学图书馆信息资源整合的情况,分析了其中存在的问题,并从用户需求和技术发展的角度对信息资源整合的发展策略进行了研究讨论。张丹丹等探讨了高校图书馆信息资源整合体系的层次构成和要素构成,从宏观、中观和微观3个层面提出了高校图书馆进行信息资源整合的思路。姜爱蓉等以清华大学图书馆为实践案例,将数字资源整合与信息门户的建设相结合,阐述了建设思路、技术手段、期望效果等具体内容。欧石燕等在对语义网进行研究的基础上,尝试将其应用到图书馆的信息资源整合之中,并且从本体层面对文献资源进行整合,从关联数据层面对图书馆信息资源进行整合,从与外界资源的关联方面也进行阐述,从而描述出3层架构的图书馆信息资源语义整合框架,形成了一个较为完善的资源整合体系。肖希明等对国外图书馆、档案馆以及博物馆(LAM)数字资源的整合研究进展现状进行了综述,对LAM数字资源整合的政策和资金资助等背景情况、合作关系及开展形式、相关平台建设、面临的问题及发展趋势等主要问题进行了分析研究,为国内信息资源整合提供了借鉴参考。郑燃等在关联数据的基础上对图书馆、档案馆以及博物馆的数字信息资源整合进行了研究,探讨了关联数据的作用及发展现状,并尝试构建了基于关联数据的数字信息资源整合模式。而基于知识服务,丁楠等构建了面向知识服务的图书馆信息资源整合模型,主要从整合层、服务层、资源层3个层面进行了研究,并结合应用实例论证了该模型的可行性。
•网络信息资源整合。李富玲等介绍了国外的一种新型信息资源整合工具——SFX,即网络电子资源无缝链接整合软件系统,并对其工作原理、工作方法、使用现状和优势进行了分析,但是尚未涉及网络信息资源整合理论层面的研究。金燕对网络环境下信息资源整合的步骤和方法进行了探讨,并且从网络信息的组织管理、信息资源的整合评价以及信息商品的定价等方面进行了分析研究。而近年来,马费成等从关联数据的基本思想理念出发,提出了基于关联数据的网络信息资源集成框架,并进一步完成了针对免费网络学术资源的集成实验系统的设计实现。李雪梅采用基于B/S架构的3层体系结构进行设计,将网络信息资源整合平台分为表现层、业务层和核心层。
从全球范围看,早在20世纪80年代,美国信息管理学家Horton便将集成思想纳入信息资源管理领域,Horton提出:“信息资源管理是一个集成概念,它将不同的信息技术和领域融合为一体,这些技术和领域包括管理信息系统、记录管理、自动数据处理和电子通讯网络等。”与此同时,M. Cooper认为信息资源管理意在学术、方法、职能和技术层面上的集成或协调。从信息科学和管理科学的角度来说,信息资源集成是以信息技术为基础,向各个领域拓展开的创新管理活动。
国外信息资源集成的研究成果大都表现为信息系统集成的研究。N. W.Paton等提出了一个信息集成系统框架,该框架包括用户交互接口、概念模型管理、资源集成和封装。M. C.Rousset等认为,信息集成系统是用户和多种异构数据源之间的中介系统,信息集成系统提供一个统一的查询接口,需要经常收集和处理不同信息源的信息,因此作者建立了一个基于中介的信息集成代理框架。Jia-Lang Seng等提到XML可以解决结构上异构数据源的集成,他针对语义上异构数据源集成提出了基于本体的信息集成系统框架,最后建立了系统原型,对提出的框架进行了验证。J. Wolfert等建立了基于SOA体系结构的信息集成系统。Quix C等探讨了科研信息管理(RIM)中的信息集成问题,论证了信息集成方法对科研信息管理的适用性,认为应将科研信息集成研究的重心放在数据模型与集成过程之间的映射上。Hanh H H等研究了语义Web下数据混搭的集成问题,系统地提出了信息集成中语义混搭研究与应用的方法,并提供了一个链接数据混搭应用程序作为方法的阐释。He L等通过研究领域本体的集成与共享问题来解决信息集成与共享的问题,并对该方法进行了案例证明。Meng Tao等针对多媒体信息,提出了一种基于概念关联的信息集成和多模型协作框架,用于增强多媒体数据的高级语义概念检测。Zheng J等对高等教育信息集成研究中不同部门之间的数据共享问题进行了研究,提出了一种基于教育信息集成的非结构化数据共享模型。
在信息集成系统实践方面,自20世纪90年代后期,国外图书馆和IT界相继开发了十几种信息资源整合系统,包括EN Compass with LinkFinderPlus、MetaLib with SFX、Millennium Access Plus(MAP)、WebFeat、Chameleon iPortal、Ilink、iPort、xdirectory and xflow、Zportal、uPortal等。国外的信息资源整合系统由于起步早,功能比较完善,应用也比较成熟,但国外的信息资源整合系统比较贵。国外信息资源整合的系统还应用在电子政务领域,例如美国政府网站提供一站式服务平台。与此同时,企业界也在不断研发信息整合系统以提升生产力。Viljamaa E等提出了将基于本体的信息集成系统和通信与机器控制系统进一步结合,以提供更有效的信息整合,加强施工控制,实现实际施工工程更高效的流程管理。富士通(Fujitsu)实验室与爱尔兰国立大学戈尔韦数字企业研究所合作研发了LOD利用平台(LOD Utilization Platform),用于收集和存储世界各地以链接数据形式发布的数据,并提供搜索功能。Cordeiro K D F等针对复杂环境中数据异构和高度动态的信息流,基于Draph Data模型提出了aDApTA方法,用于信息集成及其相关架构的自适应。Pang L Y等针对企业内数据源的异质性,提出了一种数据源互操作服务(DSIS),为异构数据源提供查询和信息集成服务,并附带一组可视化工具,供用户管理和配置企业内的不同数据源。Singh A K等研究了信息集成对供应链决策的影响,发现对稳定和随机订单的信息进行整合能显著降低库存水平和牛鞭效应。Kang Y等提出了资本项目行业的信息整合成熟度模型,用于评估目前的信息整合状态,并帮助组织制定信息集成的系统规划。