ODPS权威指南 阿里大数据平台应用开发实践
上QQ阅读APP看书,第一时间看更新

推荐序三

IT时代,在短短几十年间积累了多达数ZB的数据,这些数据散落在数千万家企业的服务器以及上百亿的个人设备上,沉睡着。今天我们开始步入DT时代,大数据正在被激活,将给电子商务、金融、健康等多个行业带来极大创新和变革。

2010年至今,阿里小贷基于ODPS构建了一套完整的大数据应用系统,创造了1秒钟放贷的互联网金融奇迹。我有幸全程参与其中,并作为ODPS第一代用户见证了它的整个成长历程。时至今日,ODPS在集群规模、计算性能、编程能力、安全管控等方面已经有了质的飞跃,阿里巴巴内部有几千名工程师在使用ODPS,为阿里的多个业务板块构建大数据应用。妹芳写的这本书,立足于阿里的实践,为读者全方位地展现ODPS的应用场景,对于ETL工程师、BI分析师、数据科学家乃至运维人员,是一本不可多得的权威指南。

全书以应用视角来编排,作者采用循序渐进、以事带理的书写方式,从创建账号到搭建数据仓库、做数据挖掘,每一步都有详尽的指导,对于初学者而言可谓是最佳入门指引。而对于已经接触过ODPS或者有一定大数据处理经验的读着,书中在SQL、MR编程框架方面有深入的技术探讨,同时作者还提供了大量真实的应用场景说明和示例代码,从日志分析到机器学习,将阿里巴巴在大数据领域沉淀下来的实践经验和盘托出,对于读者构建大数据应用极有参考意义。

古语说得好,有容乃大!当“大”数据遇到ODPS这种体量的“容”器,数据变得触手可得。愿这本书为你和ODPS、大数据之间建立起一座桥梁。

陈鹏宇(不老)

阿里高级数据仓库专家(ODPS骨灰级用户)