2.2 建立全局视角:企业数据地图
“地图”一词最早指描述自然、区划等地理信息的符号图形,通常指纸质的,如今也可以是数字化的导航软件,甚至可以指认知中的逻辑关系图。比如,心理医生认为每个人有自己的“心智地图”(Mind Map)(见本章参考资料[6]),数据工程师则可以为企业构建完整的“数据地图”(Data Map)。
抽象的“地图”代表关系,关系有两层含义:其一是“所言”与“所指”的映射(Mapping);其二是地图中各个构成元素之间的关联(Relation)。比如,“生产过程明细表”指向的是生产车间中不间断的生产过程(Mapping),同时它的前序是原材料消耗表,后序是包装和仓库登记表。
彼此上下之间有映射关系,左右之间是关联关系,基于这样的理解,可以建立不同业务模块之间、不同数据表之间,乃至不同指标之间的关系地图。在为某汽车集团准备专题分享时,笔者简要绘制了汽车制造销售公司的数据地图草图,公司级别的数据地图又可以按照部门或者业务主题拆分为更多的业务地图模块,如图2-4所示。
图2-4 以汽车制造和销售公司为例,绘制公司级别及部门级别的数据地图
分析是以业务主题为模块展开的,分析师可以将公司数据地图中的每个部分展开,层层剖析,从而构建更加精细化的“业务—数据—分析”地图,直到形成一个业务完整、自成体系的主题单位。
以企业制造销售过程中的销售主题为例,它既是更大主题的“子集”,又是“五脏俱全”的整体。如图2-5所示是汽车销售业务的宏观概览,从业务层、数据层到分析层,抽象化水平越来越高,前后相互映射,左右彼此关联,共同构成了数据地图的体系。
图2-5 汽车公司总体地图中销售主题的细化
在笔者的咨询实践中,也会在图2-5所示的流程图中标记Tableau Server对应的数据表、数据表详细级别、数据更新频次和数据量等相关内容,更好地发挥地图的指引作用。
有了地图引导,业务、数据、分析的每个层次既可以作为完整的整体,又可以独立展开。
· 分析层,展开为业务指标体系,以及指标之间的关系,绘制“指标树”和彼此的关联关系。
· 数据层,可以使用UML(统一建模语言)工具绘制数据表之间的逻辑关系(第4章就是这样的案例,如图4-2所示)。
· 业务层,使用流程图绘制业务之间的流程关系。
正如Engles所说,真实世界、所知世界、符号世界是层层递进的,后者是前者的投影和抽象(见本章参考资料[1])[3],每次抽象过程会损失很多细节、增加很多逻辑概念,逻辑的体系归纳了现实世界,并最终帮助我们更好地理解现实。那些能轻松驾驭逻辑、抽象概念,并能在数据地图中始终保持清醒的人,才能成为衔接业务世界与分析世界的高级业务分析师。
很多人之所以在数据分析的世界中迷路,一个重要原因是习惯性地跳过中间数据层。
当然,数据地图还要掌握一些绘图工具的使用方法、业务流程概念、E-R模型的知识等,这些内容超过了本书所能阐述的范围。初学者可以在阅读过程中配合Process On等轻量流程图工具学习。