数据可视化分析:分析原理和Tableau、SQL实践(第2版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.2 明细表与聚合表:聚合的逻辑过程

既然分析的本质是聚合,那么聚合必然是由较多的明细表到较少的结果表的抽象、计算过程。因此,本节就从业务视角,介绍聚合的起点、终点数据表的差异。只有深刻理解聚合过程,才能理解更多的聚合分类,以及聚合度等更抽象的概念,这是通往高级问题、多维分析的必由之路。

比如,“各子类别的销售额总和”,最终可以表现为3行2列的交叉表,它是从“示例一超市”数据的“销售明细表”中聚合而来的。在分析实践中,聚合前的数据表是“明细表”,用于记录业务运营过程(operational recording-keeping),因此又可以称为业务明细表、业务过程表;而聚合后的数据表是自定义交叉表,用于回答问题、辅助管理决策(business decision-making)[2],因此又可以称为问题聚合表、分析聚合表、聚合中间表、透视表等。聚合表与明细表相对而存。

理解“业务明细表”和“问题聚合表”的特征、规范,是理解问题分析过程、数据准备、数据合并乃至数据仓库技术的重要基础。