一本书读懂大数据
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第8章 看看大数据的价值在哪里(2)

5.产出数据的价值

从数据的价值来说,很多数据本身并没有特别的含义,但是在几个数据组合在一起或者对部分数据进行整合之后就产生了新的价值。比如,在电子商务开始初期,很多人都关注诚信问题,那么如何才能评价诚信呢?于是就产生了两个衍生指标,一个是好评率,一个是累积好评数。这两个指标,就是目前在电商平台的页面上经常看到的卖家的好评率和星钻级别,用户能够基于此了解这个卖家的历史经营状况和诚信状况。

但是,仅以这两个指标来对卖家进行评价,会显得略微有些单薄,因为它们无法很精确地衡量出卖家的服务水平。于是,又衍生出更多的指标,比如与描述相符、物流速度等,这些指标最终变成了一个新的指标——店铺评分系统,可以用之来综合评价这个卖家的服务水平。

当然,某个单一的商品在电商网站上可能会出现几千条评价,而评价中又是用户站在自己的立场描述的,但是推及到某个用户上,每次买一样东西都要阅读几千条评价显然不太可能的,因此就需要把这些评价进行重新的定位,以产生出新的能够帮助用户做出明智购买决策的数据,这些数据就是关键概念的抽取。

在认识了数据的价值后,我们就能更好地识别出哪些是我们想要的核心数据,就能够更好地发挥数据的作用。精细的数据分类,严格的数据生产加工过程,将让我们在使用数据时游刃有余。

大数据不一定有大价值

国际权威的数据公司对数据的价值有这样的一个预计,到2015年,大数据市场将增长至169亿美元,该领域每年的增长率将达到40%,约为其他信息技术领域的7倍。有的研究公司指出,2011年,大数据专营供应商财政收入不到5亿美元。尽管这只占该领域总收入的较小份额,但他们认为,这些大数据专营供应商已成为创新的主要来源。

不可否认,很多互联网企业掌握着庞大的数据,如果没有对其进行数据分析,这些大数据就是一个沉重的负担。前面说过,光是采集和储存这些数据都要耗费很多人力资源和时间成本,而采集到的数据不经分析就无法给企业带来利润,企业在这一过程中就只有支出没有收入。

麦肯锡公司调查发现,大数据确实给很多行业带来了价值,比如为美国的医疗行业带来了每年3000亿美元的价值,而其他的行业也一样可以从大数据中受惠。

大数据带来大价值,但是大数据不等于大价值。就像一座未开发的金矿不等于黄金万两一样。金矿只有通过开发成为金砖并放到交易市场上之后才能产生价值,而数据只有通过技术和分析工具显现在大家面前,使得数据变成信息,然后分离出有用的信息,才能产生价值。大数据也是一样,无非就是数据的量不同。

大数据就像一座庞大的冰山,大量的数据都隐藏在海面之下,显现出来的只有一点点。如何将这些大量的数据挖掘出价值,这是和IT技术进步相关的。现在,计算机的硬件和软件计算能力都越来越强大,使得我们从大量数据中提取有用信息的速度也越来越快,很多以前我们无法计算的问题现在都能够得到解决。例如,富士通帮日本的医疗机构做数据挖掘,其中一个项目是将很多电子病历、抑郁症患者的DNA信息、抑郁症患者的重点发病地都结合起来。他们根据病例、气象、DNA、地域数据,分析抑郁症患者自杀的概率,建立数据模型进行验证。这在过去是不可能做到的,但现在有了IT技术,可以把假设通过技术很快地运算并加以验证,这样,以前没有体现出价值的数据便体现出了价值。

另一方面,过去某些大数据可能也是可以进行分析的,但是因为数据量太大或者计算过于复杂,得到结果的速度实在太慢,等待结果出来时,数据的时效性可能已经过了。比如我们要预测第二天的天气,以前的计算机可能需要三四天才能够计算出来,而等计算出来,预测本身已经失去了意义。而现在,同样的计算可能只需要几个小时,这样,预测本身的价值就体现出来了。

大数据不等于大价值,但大数据分析做好后,就会带来大价值。随着大数据技术的发展,一些现在将大数据视为负担的企业将越来越多地感受到大数据分析带来的甜头。

大数据的价值遗憾

因为数据给人带来的实际用途是优劣并存的,所以大数据的价值到底有多大,目前没有谁能给出准确的计量。

2013年,国外著名的社交网站脸谱实现60亿美元的收益,而创造这么多收益的脸谱居然没有向用户收取一分钱。脸谱的所有服务对用户都完全免费。如果你是脸谱的用户,你会不会觉得你使用脸谱的服务简直是在占这个网站的便宜呢?

脸谱不是慈善机构,它的管理者不是国王,其网站不是供所有人免费使用的牛皮公路。事实上,正如2010年《时代》周刊评选出的100位最具影响力的人之一的思想家杰伦·拉尼尔所说:

“脸谱的用户2013年将为这家公司创造60亿美元的收入,却得不到一分钱的报酬。”拉尼尔为什么这么说呢?这又是一个大数据的案例了。脸谱应该有自己的赢利方式,只是人们不知道它是如何赢利的罢了。这是非常正确的想法,事实也确实如此。脸谱的价值正是数以亿计的用户在使用过程中不知不觉积累的大数据形成的。通过分析用户的爱好、身份资料、个人信息和浏览习惯,脸谱就能够猜测到每个用户的消费喜好,比如,你最容易被哪类广告吸引,每个网站页面都有一个“喜好按钮”,哪怕你从来不按按钮,你的信息也会被反馈给脸谱。

在大数据时代,数据就是金矿,而创造数据的用户便是产生金矿的原材料。脸谱的主要产品是社交网络,而造就一个良好社交网络的最重要因素是它的内容。为脸谱提供内容的,正是一个个用户。用户提供的内容使网站变得美好,而他们的个人信息使得网站变得有价值。

这一切都解释了为什么像脸谱这么一家雇员少于5000人的公司,如今市值超过650亿美元。在拉尼尔看来,这是一种巨大的不公平,也是大数据时代的一个巨大缺陷。像脸谱一样的公司,通过收集我们的各种行为数据获得巨大利润,而我们的行为本身却被视为是毫无价值的,似乎它们无须为我们的劳动付出任何报酬。这么看来,在大数据时代,表面上我们是在免费使用着某些公司的各种资源,而实际上是我们付出各种劳动,某些公司免费搜集着我们产生的数据,没有给我们任何报酬。

如今,大数据能在各行各业发挥其他工具完全无法代替的作用,但大数据并不是万能的,并不是任何时候、任何场合都适用的。大数据本身也有局限性,在大数据成为一个热门话题的今天,我们不能迷信大数据,而是需要弄清楚状况,知道什么时候需要使用大数据,什么时候需要使用其他工具。