1.4.5 数据中台与数据编织
数据编织(Data Fabric)是最近数据技术领域一个比较火热的词,业界对于数据编织有多种理解,并没有统一、标准的定义。综合业界的多个定义来看,数据编织是一种设计理念,通过一套数据架构思想,统一管理并链接所有数据源,利用知识图谱和AI能力面向不同的数据使用场景提供准确、方便的数据访问,从而更高效、更大限度地发挥数据价值。
数据编织旨在解决大数据时代海量数据以及多云的复杂架构导致的数据孤岛加剧、数据集成成本高、数据使用难的问题。有了数据编织这套设计理念,企业可以在不迁移数据的情况下,方便地了解自有的数据资源,并根据业务需要快速访问所需数据。数据编织融入了知识图谱和AI能力,能够将合适的数据在合适的时间传送给合适的使用者。基于以上分析,数据编织应包含以下几方面的能力。
❑异构数据源连接能力:能够连接多个系统多种异构数据源的数据,包括各种业务系统、数据仓库、数据湖、文档系统等。
❑智能数据编目能力:对连接的数据源进行自动识别并获取元数据,获取元数据的同时识别数据的消费行为,对数据和数据消费行为自动编目,形成企业数据知识网。
❑数据连接能力:能够在不同的数据之间建立连接,简化数据访问模式。
❑语义理解能力:理解数据的业务含义,面向不同的使用者有针对性地进行语义表达。
❑智能建模能力:面向不同的使用场景,具备自动的智能建模能力,帮助用户获取场景化的数据服务能力。
可以看出,数据编织是一种数据技术的设计思想,强调智能化的能力。而数据中台是一套让数据用起来的机制,不仅包含数据技术,还包含企业战略、组织文化、运营机制等多个方面,目的是通过一整套机制的配合让数据在企业业务中被持续用起来。数据中台和数据编织不是非此即彼的关系,两者可以相互配合。数据中台可以借鉴数据编织的设计理念,数据编织可以借鉴数据中台的运转机制。