大数据战争:数据在全球市场的使用与滥用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

数据、市场和民主

苏格兰社会评论员托马斯·卡莱尔(Thomas Carlyle)在《宪章运动》一书中写道,一位机智的政治家“可能会用数据来证明所有事情”。我们都知道一句著名的格言:“世界上有三种谎言,即谎言、糟糕透顶的谎言和统计数据”。用吉仁泽和他同事的话来说,如果我们的社会已经意识到数据能够用来证明什么,“那是因为他们经常做了(错误的)证明”。当专家的主张过多时,“政治和社会制度允许他们这么做,甚至鼓励了他们的虚荣自负”。法国哲学家雅克·埃吕尔(Jacques Ellul)曾经写道,“现代人需要一种与事实真相的联系”,这像是一种“用某种方式说服自己的自我辩白,让他觉得自己是一个服从理性和实证经验的人”。但埃吕尔的所指并不是科学,他的分析重点在于宣传的意义和形式。在埃吕尔的理解中,数据的使用对于“在理性和事实性因素的基础上创造非理性的反应”是至关重要的。

为了成为社会辩论的一部分,个人和团体必须呈现一些数据。没有数据,论据将被视为缺乏可信度,而只是基于纯粹的经验之谈。正如贝斯特所说,“数据是因为要为政治斗争提供武器而被创造和复制的,而这种政治目的通常被隐藏在一种断言后面,即数据,仅仅因为是数据,所以一定是正确的。”媒体进一步放大了对数据的操纵。它们迫切需要简单的故事情节。它们努力地汇报“事实”,而粗浅的数据是强大的营销工具,因为它们吸引人们的眼球,容易引发争议,还简化了记者的工作,记者不再需要仔细分析各种意见和细节。正如哥伦比亚大学新闻研究院的一位讲师认可的那样,“我被培养成了这样一种人,我只相信能够观察到的和可以量化的事实……新闻记者在看到平均成功率、股市行情、人口普查、选票统计时,才能得到最大的安全感。”

《数据是靠不住的》一书作者查尔斯·塞费(Charles Seife)在书中引用了美国国防部在越南战争期间发明评估体系的例子,该体系用先进的计算机向媒体提供各种统计资料,以表明美国正逐渐在这个东南亚国家的战争中赢得胜利。但是,事实当然不是这样的:“这种信息是新闻的原始材料。它给了新闻记者们表达观点的依据;如果记者的言论不能被硬性事实支撑,他们在表达时就容易显得软弱无力。”一旦某个数据出现在了新闻报道中,它就走上了自己的轨迹,并会经历一段像洗钱一般“数据合理化”的过程。其可疑的起源会被瞬间遗忘,通过不断地复制,该数据开始被视为一个明确的事实,“准确而权威”。不久,数据所经之路变得模糊不清:“人们忽略了数据的原始来源,却认为这个数据一定是正确的,因为它随处可见。”

正如美国国防部伪造数据支持保守派媒体的宣传,使媒体得以引用战争中的死亡人数、俘获的武器数量和部队人数来“描绘战争将胜利的美好画卷”。反环保主义者的游说团体也进行了相关研究并呈现出数据模型来佐证各种各样的虚假联想,他们说高油耗的多功能车(SUV)比混合动力车更利于环保,还说全球变暖现象并不存在。数据推理的应用经常会为一种系统性的否定做好准备,强大的利益集团十分支持这种应用,尤其是在美国。数据“谎言”的产生看起来是违反直觉的,它并不是为了说服意识形态的敌人,而是为盟友提供一个数据库。2007年,一个市场研究小组发表的研究显示,众所周知的高油耗车型悍马H3比丰田普锐斯更加节能(他们认为悍马比普锐斯拥有更长寿命和可行驶更长里程,利用这两个因素设计新的模型,降低了前者对整体环境的影响,从而得出结论),反环保主义专家和全球变暖的怀疑者由此重新得到了激励。这些虚假证据迅速席卷了主流媒体,《华盛顿邮报》为气候变化否认者开放了专栏文章,他们呼吁人们购买悍马车,“以代替丰田普锐斯”。正如历史学家内奥米·奥利斯克斯(Naomi Oreskes)和埃里克·M.康韦(Erik M. Conway)在医学和环境研究领域对反对科学的力量进行分析时所表明的那样,媒体已经成为对虚假数据心满意足的支持者,毕竟新闻记者们总是将统计数据视为一种无可争议的证据。考虑到记者是经过培训的持中立观点的代表,数据的呈现已经成为那些有意传播怀疑观点,阻碍某些关键领域改革的人手中的有力武器。比方说,他们会进行风险炒作,将预防原则应用于健康领域和环境规制:“无论错误一方的观点多么荒谬可笑,或者多么依赖‘数据的骗术’,新闻媒体都会报道它、增强它,让这些人造的‘事实’显得很有生命力。”

新闻报道对股市指数的迷恋是媒体与数据间密切关系的最好例子。在20世纪80年代以前,只有专门的媒体机构会提供国内外市场的股票信息,几乎没有媒体会参考股票指数。例如,称得上是世界上最知名的股票指数的道琼斯工业平均指数(通常被称为道琼斯指数),是在1896年首次公开发布的;尽管20世纪的投资者们十分青睐道琼斯指数,它在大萧条时期还曾一度暴跌,它真正流行起来还是在20世纪90年代,那时的综合性报纸和电视台才开始在定期出版物和播放中引入股市信息。同样地,在20世纪50年代开始正式编制的标准普尔500指数,在21世纪才有了全球知名度。纳斯达克综合指数在1971年开始运作,到了20世纪90年代末,随着互联网泡沫的出现,它才登上了全球的头条新闻。从那以后,这些数据(连同国家和地区的各项指标)几乎成为每个国家公众辩论中的主角。媒体每天都会根据股票市场活动的平均值和估计值,为我们提供股票行情表和时间序列。各种专家会对此作出评论,数据不断在后台滚动。动画图形和复杂的表格给这些数据增加了重要的光环。媒体经常会带给我们这样一种印象:股票指数是一项公益事业,是一国经济健康的指标。交易量比较低的时候,国家就经历着糟糕的一天;交易量高的时候,媒体则会为此而庆祝。这种看法也影响着我们的整个社会:当指数上涨时,我们欢呼;当它下降时,我们忧伤。但股票指数代表的究竟是什么?事实上,这些数据和公益事业毫不相关,仅仅只是用来描述私人市场交易的一部分主体的情况而已。股票指数只包括了那些上市公开交易的公司,它们实际上只是全球私营部门中的一小部分。而且,这些指数只涵盖了这些公司中规模最大的一部分(以总体股票价值计算,而非资本或劳动力规模)。打个比方,道琼斯指数仅仅包含了三十只股票,虽然它们已经能粗略地代表四分之一的总股票市值,但也确实没有包括任何中小型公司。它仍然是美国最主要的市场晴雨表。标准普尔500指数对市场的整体覆盖面比较广,但由于它有市场资本加权制,所以会给大公司一定的特权。最后兴起的纳斯达克指数则只关注科技股。所有的股票市场统计数据也是如此。由于这些指数能被用来吸引投资,它们会攫走本将投向小公司和地方经济的资金。在世界很多地方,实体经济非常有可能受到对股票指数盲目乐观的影响。这些数据并不是经济发展的信号,而是以牺牲中小企业为代价加强大资本,对市场造成的扭曲。

这些指标都不是市场动态的真实参考,更不用说能用以衡量经济健康。然而,媒体炒作已经成功将它们融入了我们的社会心理,从而加强了金融资本主义的政治控制。韦伯将数据的力量与资本主义意识形态的霸权主张联系在了一起。他把资本主义制度定义为“一种附带资本会计的体制,即按照现代簿记和收支平衡原理计算确定收入的体制”。而且,数据的受欢迎程度也影响了我们对价值的理解。股市指数并不能衡量企业的实际价值。它们反映的是股票预计的交易价值,也就是投资者愿意为购买股份花多少钱。当投资者对其非常有信心时,这种价值会大幅上涨;若投资者破产,股价也会相应地崩盘。《哈佛商业评论》前任编辑乔尔·库尔茨曼(Joel Kurtzman)曾强调,“机构如今不再购买和持有很多股票,因为他们信任公司的潜在价值”。恰恰相反,他们会买进卖出股票,通过“一些数学公式的帮助”,缩短持有股票的时间。正如国际政治经济学家罗内·帕兰(Ronen Palan)所说,“我们用来反映股票估值、利润和财富的数据不再能折合成‘真正的’有形商品,它们是将‘权力’当作纯粹的关系来衡量。”然而,由于媒体自身的数据自信和批判性分析的缺失,这些指标传达了一个错误的信息,即当数值上升的时候,实际财富正在被创造。从而,当市场整体情绪高涨时,我们会感到富有;当这种“虚假的”财富蒸发时,我们突然感到了贫穷。正是因为这些数据,我们都成为市场社会中无意识的利益相关者。

有些数据在本质上显得比较微妙,所以会特别隐蔽。它们不以传统的统计格式显现,也不出现在复杂的公式中。它们非常简单明确,我们几乎忘了它们也是数据,是抽象的概念和人类的发明。价格就是一个完美的例子。我们的日常被价格包围,我们会通过商品标价来看世界,让它帮助我们做出决定。无论是选择假日旅游的目的地、孩子要就读的学校,还是考虑看望父母时,价格都会成为我们做选择的基本参数。价格已经成为价值最有力的标示。每件物品都要值得它们的标价,或者与我们愿意付出的钱对等。正如奥斯卡·王尔德(Oscar Wilde)在《道林·格雷的画像》中写到的那样,“如今,人们知道所有东西的价格,就是不知道它们的价值”。

价格不仅在我们的日常生活中普遍存在,还具有宏观经济统计的功能。例如,有史以来最强大的指标,万能的国内生产总值(GDP)就是以市场价格度量的商品和服务的总和。我在前一本书《GDP究竟是个什么玩意儿》里谈到了GDP背后的政治性。我们在此不多谈,只将GDP视为一项“总额”,而不包括生产过程中的物资贬值(比如机械、工具、车辆等)。在市场之外的各种交易(例如家庭内部交易、非正式经济、易货交易等)也不被计入总额。此外,GDP并不会考虑到经济增长过程中消耗的自然资源价值,因为这些资源能免费从自然界获取。GDP甚至也不会将污染和环境退化的经济成本纳入,而这是工业发展造成的明显后果。所有这些重要的遗漏使GDP对经济实绩的衡量具有很大的选择性(有些人可能会认为这一数据会使人变得目光短浅)。比方说,家庭服务即使没有在市场上被定价和交易,也仍然会产生根本性的经济影响力。如果政府不得不为家庭层面的各种服务付费(包括对孩童和弱者的照顾、教育问题等),那我们的经济发展就很可能陷入停滞状态。最近,一项估算美国家庭生产价值的研究表明,从1965年到2010年,美国家庭内进行的各种生产活动每年占经济产出的30%以上,这一比例在1965年达到了39%的最高值,2010年时则下降到了25.7%。在很多国家,“临时工作”和非正规的商品和服务交易为数百万人提供了必要的生活来源。尽管这并不会在GDP上表现出来,却常常构成了实体经济的骨干。同样地,因为自然资源没有定价就忽视了它对经济的投入,这使我们遗忘了只有在生态系统不断提供“资本”的情况下,经济增长才能得以实现。没有干净的土壤、水、空气和其他重要的天然过程,农业生产是无法进行的。没有地球提供的化石燃料、碳氢化合物和能源,工业化也无法实现。然而,当这些资源枯竭时,我们面临的风险不仅是经济发展的停滞,还有危及生命的自然失衡。会计学基础告诉我们,利润等于收入减去“全部”成本。由于GDP经常忽略经济中的一些关键部分和重要的成本花费,没有任何明智的商人会将它应用于公司经营。然而,它已经成为整个社会运行的重要参数,正如一篇发表在《经合组织观察家》上的文章提到的那样:


如果说统计界有一个颇具争议性的标志,那一定就是GDP。GDP衡量的是收入,而非持平状态;它衡量增长,而非破坏。它会忽视社会凝聚力和环境的价值。然而,政府、企业,还有大部分人,都无比坚贞地信赖着它。


定价机制在制定公共政策方面的应用有着悠久的历史,它可以追溯到欧洲和美国现代工程技术发展的时期。当时,在基础设施的建设中,人们需要数据化的评估工具,以便给税收征管带来便利。19世纪下半叶,含有量化因素的公共管理变得相当普遍,尤其是在公共工程的定价问题上、招标的分配,以及公民在通过大桥和铁路时需支付的通行费的计算,都会用到定量的方法。举例来说,法国工程师朱尔·杜普伊(Jules Dupuit)就是第一个在火车票定价中引入诸如边际效用递减率等概念的人。杜普伊认为,数学推理的确定性对于良好的政治经济分析至关重要。他解释道,立法者的准确定位应该是要“把这些政治经济所表现出来的事实奉为神圣”。

弗里德里希·奥古斯特·冯·哈耶克(Friedrich August von Hayek)是自由市场经济学的先驱,他率先将价格综合理论发展成为各种指标,也就是信息带来的信号。他曾于1945年在《美国经济评论》期刊上发表了一篇颇具影响力的文章,名为《知识在社会中的利用》。他在文中写道,价格体系是“一种记录变化的工具,或一种通信系统,这种通信系统能使单个的生产者像工程师观察一些仪表的指针那样,来观察一些指标的动向”。哈耶克认为,社会是“一个关于相关事实的知识分散地掌握在许多人手中的体系”,而在这个由部分信息构成的万花筒中,“价格能协调不同个人的单独行为,就像主观价值观念帮助个人协调其计划的各部分那样”。然而,尽管哈耶克对价格的交际功能抱有极大兴趣,但他也认识到价格只是“一种数据指标,这种指标不可能从特定的物品所拥有的任何特征中得出,但它却可以反映,或者在它身上集中了它在整个方法目的结构中的重要性”。

在哈耶克将价格定义为信息的信号后,经济学家费雪·布莱克(Fischer Black)、迈伦·斯科尔斯(Myron Scholes)和罗伯特·莫顿(Robert Merton)开发了复杂的公式来预测各种金融交易中的价格,特别是在衍生品市场。三人建立了布莱克-斯科尔斯-莫顿模型(Black-Scholes-Merton model),莫顿和斯科尔斯因此获得了1997年的诺贝尔奖,这一模型很快就成为全球金融领域定价方法的重要参考。随着世界经济日趋金融化,价格成为价值的完美替代品,金融市场成为资源配置的可选择空间,这也进一步影响了我们的治理模式和社会评估财富的方式。

直到2008年9月,这个有着完美定价规则的世界开始崩溃了。美联储前主席艾伦·格林斯潘(Alan Greenspan)在众议院监督与政府改革委员会的一场听证会上承认,“定价模型的发现曾被授予诺贝尔奖,这个模型奠定了金融衍生品市场的发展。现代风险管理思想盛行了数十年,但是这个知识体系却已分崩离析。”那只是全球金融危机的开始,而后,这场危机席卷了整个世界,并造成了大萧条以后最具破坏性的经济衰退。然而,价格对我们社会的控制是不受金融世界的经济混乱影响的,在经济危机阶段,数据的力量比以往任何时候都更加强大。

价格是指标。它是在资源稀缺的情况下,因供求关系而确定的综合性参数。从理论上来说,价格应该大致对应于商品和服务给个体消费者带来的边际效用。实际上,在大多数实体经济体中,价格根本不是(或只是部分)由消费者的偏好和优先选择顺序确定的。一般来说,价格很容易受到供求关系良性的外部动力因素的影响,其中包括税收、补贴、企业联合、垄断等,更不用说能够提供给某些行业特惠待遇,却不适用其他行业的鲜明政治立场。由于价格(和货币量)受信贷影响很大,金融家、投资者、银行家和保险公司的贴现率在很大程度上决定了什么样的东西才是真正有价值的。我们的经济状况比以往更依赖少数人的偏好。

价格和市场总是齐头并进的,因为前者是交换价值的具体指标。显然,那些附有价格标签的物品就能在市场上进行买卖。因此,价格的普适性导致了市场的增长远远超过了惯例上与利润相关的传统市场界限。我们现在制定了碳的价格,并有着与碳排放相关的市场;我们有适用于非盈利部门的财务模式;用市场和价格来迎合生物多样性,应对碳排放和森林资源管理;根据保单的价格来评估一个人的生命价值。诸如成本效益、支付意愿、重置成本和投资回报等经济概念在我们的治理模式中占据了主导地位。从局部上来说,大多数的公共机构都采用了从商业中借鉴的管理公式;在全球范围内,我们在气候变化和环境退化等问题上引入了市场机制。最近的一些研究也显示了数据化组织的运作原理,即通过数据的合成表现出某种财富,以促进资本在离岸经济中的流动,这样就会加大超级富豪和其他人之间的全球性差距,也破坏了各国维护福利制度的能力。

2004年,哈佛大学校长劳伦斯·萨默斯(Larry Summers)公开庆祝了数据的胜利。他称赞“魔球”已经成为棒球界最成功的预测模式,并坚持认为,“在棒球运动中正确的部分,实际上在广泛的人类活动中也同样是正确的”:


在过去的三十年里,投资银行领域已经由善于在第19洞(高尔夫术语,指高尔夫会所中的酒馆)接待客户的人主导,变为由善于解决衍生品定价中复杂数学问题的人来主导。环境监管领域在实际应用中已经基本不再受执行活动的人士或是律师的指导,而让位于能够熟练地进行成本效益分析的人。在总统竞选活动中,组织者曾经呼吁一批有才华的律师来进行辅佐,但现在他们更需要出色的经济学家和工商管理硕士(MBA)的帮助。我可以提出很多这样的例子。这正表明了从社会科学发展而来的分析技术正在得到越来越广泛的应用。


全球市场的“转变”由于对数据不受约束的信任而得到加强。正如亚当·斯密对“看不见的手”的描述,也就是对市场效率在分配资源和解决复杂的分配问题上所做的创立性假设一样,现在大家会普遍“相信数据最终能够‘自动’起作用,可以这么说”。但其实数据自身能做的非常少。它们能藏起冲突,却不能解决冲突。它们只能通过对无法逃避的问题的外在表现分析来遮掩问题本质。毫无疑问,数据是知识进步和治理改善的重要工具。而同时,它们也会成为那些希望维持现状的人手中的有力工具。