前言
在互联网飞速发展的今天,万物互联成为可能,智能分析由只专注于个体转开始变为更关注个体之间的关系。伴随着数据处理技术(Data Technology,DT)时代的到来,数据量呈爆发式的增长。在这些海量的非结构化文本数据、大量的半结构化表格和网页以及生产系统的结构化数据中,蕴含着大量的关系信息。利用知识图谱技术,人们可以对这些关系信息进行结构化、语义化的智能处理,形成大规模的知识库,并支撑业务应用,使得机器能够更好地理解网络、理解用户、理解资源,为用户提供新型智能化服务。
然而,市面上知识图谱的相关书籍,要么聚焦于科学引文网络或其他行业应用,要么主要介绍相关工具的使用,专门讲述知识图谱全面理论的书籍还比较少。作者希望以此书的出版弥补这一空白。
本书的主要特色包括:①系统性,从知识图谱的起源发展入手,层层推进,让读者对知识图谱这一技术工具建立系统的印象;②全面性,既包含通用知识图谱,也包含行业知识图谱,内容涉及较广;③基础性,本书面向对知识图谱有兴趣的读者,力求内容通俗易懂;④实用性,理论与实践相结合,通过案例让读者对知识图谱的应用有直观的了解。
全书共6章。第一章从定义、发展历程、架构、特点等方面对知识图谱进行了基础性的概念解读;第二章以知识表示与建模、知识抽取与挖掘、知识存储与融合、知识检索与推理4个过程为主线,对搭建通用知识图谱的技术要素进行了介绍;第三章介绍了行业知识图谱的特点,并重点研究了知识图谱在公安、金融、教育、电信、工业领域中的应用场景;第四章对知识图谱的发展趋势和挑战进行了分析;第五章通过医疗决策辅助系统、“虚拟生命”、股份制银行、禁毒大数据分析平台4个案例,从痛点难点、实现路径和应用效果3个方面对知识图谱的实战应用进行了解读;在第六章中,作者列举了Pajek、CiteSpace等8种国内外较为常用的知识图谱构建工具,并对各工具的主要功能和特点进行了介绍。
从最初的搜索引擎到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统等,知识图谱的应用越来越多,它在技术领域的热度逐年上升。大规模构建并应用知识图谱,对于互联网行业、传统行业甚至社会治理具有重要的意义。随着理论和技术的不断发展,学术界和产业界对知识图谱的认识在不断地变化与更新。未来,相关的研究和应用的边界将不断扩展。
本书的编写成员包括闫树、魏凯、洪万福、钱智毅、王彬、符山、姜春宇。本书在编写过程中得到了中国信息通信研究院何宝宏所长、张雪丽副所长、刘寒、刘成成、马鹏玮、王妙琼、李雨霏、王卓、李俊逸、吕艾临等同事的大力支持。厦门渊亭信息科技有限公司、北京明略软件系统有限公司、中移(苏州)软件技术有限公司、中软国际有限公司、深圳狗尾草智能科技有限公司等企业的专家对本书提出了建议或提供了相关案例,在此对他们一并表示感谢。
由于作者水平有限、编写时间仓促,书中难免会出现一些错误或有争议的地方,恳请读者批评指正。如果您有任何建议或遇到了任何问题,欢迎发送邮件至yanshu@caict.ac.cn,期待得到您的反馈。