第2版自序
感谢Tableau和读者的支持,是你们给了笔者继续前进的动力。
2020年年初,我把多年学习Tableau的所思、所想毫无保留地写出来,配以精致的图片出版发行。《数据可视化分析:Tableau原理与实践》一书收到了众多读者的一致好评,累计印刷8次,发行逾万册,多次入围“京东大数据推荐榜单”前三名。在读者群中,笔者认识了很多Tableau粉丝、企业用户及可视化爱好者。
过去两年多,Tableau产品持续更新迭代,笔者也进一步补充了SQL、数据库、数据仓库等基础知识,并对比学习了Power BI、帆软、观远等国内外多家优秀BI产品的应用。“实践是最好的老师”,笔者在分析项目咨询、Tableau企业培训、可视化开发项目的锻炼中,日渐意识到这本书中的诸多不足甚至错误,并放弃了小修小补的计划,重写此书作为近两年学习的总结。
于是,2022年4月,笔者开始重写本书的内容,并重新绘制、调整了大部分插图。历经波折,多次延迟,本书终于与读者见面。
1.第2版改进
· 增加对数字化转型的实践思考。
结合笔者多年的切身项目实践,本书总结了数据的应用及其发展阶段,数字化转型的多种路径和循序渐进的组织方案(见第1章)。
· 业务分析方法和体系更加成熟。
业务是分析的“土壤”。在项目咨询过程中,笔者提出了“业务—数据—分析”的框架体系,可以与企业业务流程相结合绘制数据地图(见第2章)。同时,围绕问题结构、聚合、聚合度和详细级别,构建了一个普适性的业务分析方法,适用于各种分析和BI工具,甚至可以作为衡量分析工具的一种尺度(见第3章)。
· 在数据合并、筛选、计算三大主题中,对比介绍了Excel、Tableau和SQL的应用场景。书中总结了“数据合并的分类矩阵”“两类筛选位置”“计算的分类”等实用方法,帮助没有相关技术背景的人更快实现超越,也有助于熟悉SQL的“技术派”更好地理解敏捷BI的精髓。高阶的BI工具绝非拖曳那般简单,在技术平民化的背后,是更巧妙的“业务灵魂”。
· 将“数据筛选和交互”独立为第6章内容,进一步强调筛选在业务分析中的重要性。筛选的类型多样、优先级复杂,应该尽可能避免滥用SUM+IF类型的条件聚合。将筛选视为分析的独立环节,是优化分析性能的关键方式。
· 强化“详细级别”的概念(替代之前的“层次”概念)。在数据表详细级别(Table LOD)、视图详细级别(Viz LOD)之外,使用“引用详细级别”(Reference LOD)代表视图之外预先指定的详细级别。笔者把数据关系、筛选和计算融为一体,这是本书最重要的知识资产,是超越Tableau理解不同工具背后的分析共性的关键。
· 调整了第3篇的知识框架。没有计算,就没有无尽的业务分析,这也是本书最重要的内容之一。
➢ 第8章深入介绍了计算的两大分类:行级别计算完成数据准备、聚合计算完成业务分析。在介绍常见函数后,借助逻辑计算介绍了两类计算的区别和联系。
➢ 第9章使用了新的框架介绍Tableau表计算和SQL窗口函数,表计算代表的“抽象的二次抽象”,是迈向高级分析的台阶。
➢ 第10章则结合“SQL聚合子查询”深入讲解LOD原理,结合购物篮分析、客户分析等经典案例,把高级分析中“预先聚合”的理念,推广到更普遍的业务分析中。
· 增加了“从数据管理到数据仓库”的内容(见第11章),相关内容是从可视化分析走向专业的数据建模、数据方法的关键。“视Tableau Server为DW/BI平台”,给了更多企业全新选择。
· 受限于篇幅,移除了之前Prep Builder数据处理、Tableau Server相关的大部分内容。
2.致谢
每次写作完成,笔者总是迫不及待地分享。本书付梓之前,笔者在上海组织了“喜乐君精品课”线下活动,详尽介绍了本书的核心内容。教学相长,在分享过程中笔者进一步发现了自身知识体系的盲点。感谢来自天合光能、汉德车桥、上海电气、海南航空、上汽集团、英飞凌等企业的热心读者。
感谢继续支持和信任笔者的企业客户,笔者希望能用专业和热爱回报大家。
感谢Tableau,你给了笔者穿过迷雾的勇气,笔者也将无期限地支持你,对得起“Tableau传道士”的称号,对得起Tableau Visionary的全球荣誉(连续4年)。
感谢父母,感谢家人,“大爱无言”,笔者当用余生以行动回报。
喜乐君
2023年1月20日