大话机器智能:一书看透AI的底层运行逻辑
上QQ阅读APP看书,第一时间看更新

2.4.2 会欺骗的视觉设计

除了隐藏数据,还有另一种常见的误导数据结论的方法——操纵图表。

人是视觉动物,对人来说,图表比文字和数字的表达更直观,也更震撼。可是在有些场合,太过精确的图表不利于理解,必须平衡信息的呈现方式和准确性。

举个例子,曾经有人激烈地讨论城市地图到底是地图还是图表。按照惯例,地图应该呈现精准的地理信息,比如建筑和道路的位置。而图表要呈现的则是事物的联系或数据的关系。对于一张交通线路图,显然地理信息是次要的,轨道交通的路线和运行方式才是重点。地铁路线图为了更直观地展示交通线路信息,就很难兼顾地理信息的真实性,只能做一些妥协。

仅凭一张图表并不一定能得到事实结论。那些不合适的图表会欺骗人们的大脑,造成视觉欺骗,甚至有时数据没有任何伪造,仅仅通过改变展现形式,就会给人留下不同的印象。无论是调整图表坐标的上下限和间隔比例,让原本微小的上升变成惊人的增长,还是改变图表的统计方法,让原本只有10%的增长率变成看上去100%的累积增长率,这些事做起来并不难。如果某人想要汇报良好的工作业绩,他就可以选择这么做。毕竟没人规定不能这么做,谁也无法指责他。

举个例子。假设你是一名银行基金产品的销售经理,打算在市面上发售一款基金产品A,经过市场调研,这款产品的竞争对手有基金B、基金C和基金D。这些基金的收益率分别是4.72%、4.42%、4.32%、4.26%。其中,你的基金A比其他基金的收益率稍高一点。于是,你根据数据做了一张图表,如图2-3所示。

图2-3 基金收益

图中,4款基金产品的收益率看上去相差不大,你的产品看不出什么竞争优势。于是,为了更好地突出你的产品,你决定调整一下图表的坐标系,如图2-4所示。

图2-4 调整坐标系

现在,纵坐标不再从0开始,上下限和间隔刻度也做了相应调整。在这个过程中,数据仍然是真实的,你只是故意让这些指标的间隔变大了。但从视觉效果来看,基金A和其他产品的差距也变大了,显然它的收益率更加突出。

几年以后,由于一些基金经理投资激进,所以基金产品每年的表现时好时坏,如图2-5所示。

图2-5 按年呈现

为了不让投资者在看到历史表现后认为基金运作不稳定。于是你调整了坐标刻度,试图让原来大幅抖动的数据变成平稳波动,如图2-6所示。

图2-6 调整坐标刻度

又过了一段时间,你打算统计基金近5年的表现。你发现,它的年收益率分别为10%、8%、6%、4%、2%,虽然一直在赚钱,但是每年的收益率持续下跌,如图2-7所示。

图2-7 基金的近5年表现

如果用上面的图来表达,则一定会让投资者失去信心。但如果使用累计收益率图,就能很好地掩盖这种收益率下降的趋势表现,让图表看起来很“完美”。累计收益率是指基金自运作以来的累计收益。以累计收益率代替年收益率,就可以很好地掩盖增长颓势,如图2-8所示。

图2-8 基金累计收益率

以上只是一些举例,图表还有其他很多“作假”方法。比如故意将一维数据(比如收益率高低)转换为二维图像(比如一个财神),以不恰当的比例来突出自己与其他对比对象的差距(本来只是长度差别,现在变成了体积差别),造成视觉冲击;或者把全量数据变成均值、峰值、极值等统计数据展示,来掩盖真实数据的变化趋势和关联关系(比如一年中的日交易量峰值增长,并不代表这一年的总交易量也增长了);又比如将没有关联关系的几组数据放在一张图表或一个坐标系中,让人误以为数据是有关的,并对它们观察和比较等。

虽然我们说一图胜千言,但这是有条件的。数据可视化需要对数据有深刻的理解,解读数据同样需要知道数据的含义。可视化的目的是客观描述事实,而不是为了隐藏什么意图。