数据的本质
上QQ阅读APP看书,第一时间看更新

引言
我们为什么要认识数据的本质

一场以大数据为核心的智能盛宴

时下仿佛大家都在谈人工智能,就像当年人人都在谈大数据一样。大数据时代源自应用所产生的巨量数据,比如微信、淘宝。但是,随后大数据反过来成为应用创新的核心,这个循环无疑为我们带来了一种全新的创新型态,那就是:用数据做好产品,用好产品拿到更多数据。

在不同场合上,阿里巴巴的马云、百度的李彦宏及腾讯的马化腾分别谈过自己对人工智能的看法和观点。这种对话有点儿像金庸小说中的华山论剑。到底是气宗(大数据)还是剑宗(人工智能)更有战略意义?我认为,两者是相辅相成的。经历了互联网最近20年的发展,我们已经积累了足够多的数据去驱动一场“智能盛宴”,以大数据为核心的人工智能渐露端倪。

2010年,“数据科学家”这个称谓的发明者帕蒂尔(D.J.Patil)和杰夫·哈默巴赫(Jeff Hammerbacher)认为,一切应该以产品为中心,从数据获取、数据清洗、搭建和管理数据设施、原型开发、产品设计等方面,去实践数据的价值。我在阿里就经历了从“数据产品”到“数据作为产品”的阶段,后者其实才是大数据的真正产物,也是人工智能的源泉。

谁掌握“完美信息”,谁就将拥有整个世界

刚开始进入数据行业时,我一直秉承着这样一个理念:在“假设数据都是可获取的”基础上,思考问题。随着整个社会数据化程度的进一步加深,以及人与物之间的高度互联,以前很多信息的盲点被快速解开。由不同领域积累下的数据形成的“完美信息”渐露端倪,这其实是一个数据从量变到质变的过程。这一“完美信息”具有无限潜能,足以让人工智能所向披靡,催生各种智能场景,并让其如潮涌至。智能时代,秉承“假设数据都是可获取的”这一思维方式,才可让你比别人更胜一筹,从而做到心中有数。

现实中,我们从数据收集、整合、判断,以至行动、再到反馈的过程并不完美,而形成数据闭环系统的阻力往往是人为因素居多。谷歌无人驾驶汽车项目的伟大之处正是给了我们重要的启发,让我们意识到自动化及智能化所需要的数据闭环系统是如何做到了既封闭又开放,其中的里应外合正是未来的发展趋势。我在阿里就经历了4个不同阶段:数据驱动决策、数据驱动流程、数据驱动产品、数据驱动业务。在此过程中,你会发现,数据驱动的目标越模糊、数据越零散、人的互动环节越多,智能项目开展起来就越吃力。

从数据战略到数据治理,别让数据成为累赘

如前所述,数据资源的积累是发展数字经济的前提。企业在向往智能时代所带来的机遇的同时,更要为企业的未来目标制定数据战略。企业不仅要关注自己现在有什么数据,更要了解未来会欠缺什么。然后,再去探讨欠缺的部分有多少可以靠自己补充,有多少需要求助他人、与他人合作以实现补充。有人把数据比喻为电能,这个比喻很生动,但与电能不一样的是,数据是可以被重复使用的。所以从战略意义上来说,第二使用权的合规性变得非常微妙。

大数据背后的逻辑是数据积累越多越好,在过去两三年,很多企业都相信有了大量数据资源后,就能对企业的业务产生更大价值。但人们往往很快就会发现,除了技术能力之外,如何妥当地管理、利用这些资源并非易事:安全合规是一方面,降低数据使用的阻力及风险也是困难重重。所以我一直倡议,数据治理不是数据部门的工作,而是公司总体的战略。这意味着,“本性纯善”的大数据也容易变成一个累赘。

数据是一种信仰,“善”用才是本质

2016年,一场围棋大战让人类引以为傲的智力顶配瞬间被AlphaGo践踏得体无完肤。而在我看来,这场大战其实不过是一帮人赢了另一帮人,而且大部分人仅注意到了智“能”,而忽略了它与智“慧”的差别:“能”是能力的表现,而“慧”是心除杂念,将智能用在具有普世价值的地方。同样的科技能力是被善用还是被滥用只有一线之差。

几千年来,人类习惯了生存在信息稀缺的年代,大数据与人工智能则为人们带来了曙光,同时也引发了担忧。暂且撇开我们会不会被机器人侵略这个问题,人类真的已经充分利用了自己的潜能了吗?数据是一种信仰,我们应该善用这个宝藏,为人类创造更美好的世界。

我们过去常说:“数据不仅是企业与企业之争,更是国家与国家之争。”但是在不远的未来,数据驱动的算法将会影响人类生活的方方面面,若想在社会中获得竞争力,我们无可避免地必须成为自己的分析师。

经历了这大半人生,作为数据分析师,我希望借助《数据的本质》这本书,在我人到中年时,交出一份人生中期职业报告,把自己的所见、所学汇总在书中,这样,既作自娱亦可作他乐。

最后,感谢大家多年来的支持!

大数据的下半场,

企业与个人如何让数据从看到用?

作者车品觉深度视频访谈为您揭晓,

瞬间扫码观看。