第一章 信息与沟通的可视化
第一节 信息时代的视觉机制
一、信息过剩与“大数据”
1.信息过剩的“症状”
信息环境像自然环境和社会环境一样,对人们的生活有着巨大的影响。不得不承认,信息的极大丰富让我们饱尝甜头,享受到信息带来的便利,但同时也遭遇了信息带来的困惑。媒介科技推动信息数量急剧上涨,其流速也不断加快,远远超过了人类对信息处理和利用的能力,以至于在过度的信息冲击面前,人们出现了一系列焦虑状态,这就是信息过剩的“症状”。信息过剩带来的负面影响在今天越来越显著。这主要体现在:
(1)信息过剩导致获取有用信息的效率降低
虽然我们拥有获取信息的便捷渠道,却面临着身陷资讯的海洋而找不到、看不懂、读不完所需信息的窘境。首先,信息过剩给信息的搜寻带来了困难,这直接导致查找信息的时耗成本直线上升,为此,人们不得不付出更多时间来查找和浏览相关信息。其次,信息过载不仅是信息量的增加,更重要的是信息降级。一方面,信息类型趋向于无意义的多样化,这种多样化对信息的接受产生了严重的干扰;另一方面,越来越多的信息内容琐碎平庸,通过打包和无节制的复制而肆意传播。
(2)信息过剩导致心理焦虑、生理疾病和一系列社会问题
托夫勒(Alvin Toffler)在《未来的冲击》一书中,将“未来的冲击”界定为人体生理适应体系及其抉择机制因负荷过重而产生了心理和生理的苦痛。简单地说,未来的冲击就是人对技术的过度刺激而产生的不适反应。按照托夫勒的观点,信息过剩是造成未来的冲击的一个重要诱因。他认为,人处理信息的能力是有限的,当过量的信息轰击人们的认知体系时,求知需求产生的压力就会超过临界值。这样一来,人们对于信息的感知就会趋于麻木,并产生一系列的心理、生理和社会问题。
我们每天都面对浩瀚的信息的海洋,面临的挑战包括摒弃垃圾信息、专注有用信息并记住重要的事情。这似乎是个难题,但是对抗信息过剩的“症状”,能帮助人们更好地迎接认知瓶颈的挑战,这始终都是信息设计努力的方向。
2.烦扰的数据
除去专业或工作性质等方面的因素,其实大多数人对数据并不敏感。不敏感的原因,可归结为两个:一是时间成本,二是信息惰性。就时间成本来说,很多人并非看不懂数据,而是没时间和耐心去读,如果数据的认知难度超过他们碎片化认识的时间限度,他们便会选择放弃。就信息惰性来说,人们每天都接触大量的信息,除非与己相关,否则大都会选择视而不见。信息时代忽略数据是社会中的一个普遍性问题,而且也会是一个永远存在的问题。但要想把握用户需求,设计师必须学会使用数据。设计师对待数据的态度,不一定要像专门的市场分析者或者财务人员那么专业,更多的是需要了解数据背后用户行为的逻辑和诉求。这就要求设计师在看到数据时,第一时间将这些数据与既定用户关联起来。那么,如何有效地面对数据呢?
(1)有重点地看数据
在做信息设计的数据分析之前,设计师首先应该搞清楚自己需要什么数据来说明什么问题。和做可用性测试一样,如果测试之前连关注点都没有办法确定,那就会被数据埋没。
一个数据对于不同的信息产品、不同的环境、不同的用户类型,有着不同的意义,人们对此得出的结论也应该是不一样的。传统的一般性市场研究对于数据分析往往是依据“硬属性”,比如,他们对于用户的分析多依据人口属性的数据,所以得到的结论有时难以切合现实的情境。这样的结论,对于信息类产品的设计来说,参考价值有限,特别是当今个性化需求越来越突出,用户行为越来越难以用统一标准来界定的时候,人口属性基本没有办法说明用户的行为逻辑。
例如,想了解有购物搜索需求的网民具备的主要特征时,年龄、学历、性别、收入、婚姻状况、消费能力、信息获取方式、上网条件等因素,可能都有参考价值,但哪些才是最重要的?分析后很快就会发现,比较而言,年龄、婚姻状况、上网时间、上网条件其实都不是最重要的,而消费能力、信息获取方式在这里才最具价值,但这些并不能从单纯的人口属性的数据分析中得到。
(2)筛选数据
筛选数据是一种很重要的信息设计能力,而筛选数据最直接的方法就是提问。作为一名合格的设计师,必须要善于提问。在很多时候,提问的水准和设计水平基本成正比。明确要什么样的数据,什么样的数据可以帮助我们解决眼前的问题,这一点十分重要。事实上,数据类型达到一定数量后,类型越多,反倒越不利于得出结论或形成判断。因为不同数据类型之间会产生相互干扰,影响最终的结论。提什么样的问题,其实决定了数据筛选的条件。
在实际项目中,必须搞清楚需要什么核心与重点数据,确定了这些,会使分析过程更加高效。把主要的几个问题想穿、打透,其他问题也就迎刃而解了。
对数据进行筛选,可以高效地帮助人们把数据看透。比如,在开心网创业的初期,很多人都夸开心网的好友推荐做得好,很多用户在上面找到了自己失联很久的同学,其实开心网只是将校友录的数据库作为筛选方式用于推荐算法里,而这一技术并非是什么高精尖的技术,很多社交网站或应用程序都在用。
(3)关心数据采集的方式和方法
很多时候,我们只提出需要什么样的数据,而并不关心得到这些数据的方式和方法。有时候,完全依靠用户研究的经验去获取数据并不可取。因为这样得来的数据并不会太准确,甚至会出现误导。因为在用户研究的过程中,使用不同的方式方法,得到的结果可能完全不同。
比如还是要做一个购物搜索的网站,不应该只关心“用户目前获取信息的方式”“搜索的商品类型”等,还应了解数据来源以及获取方式,这样才能判断数据的有效性。访谈、焦点小组、问卷、电话等不同的用户研究方式、方法和渠道,得到的数据的性质也不一样。此外,不同从业经验的人采集到的数据,其结果也会不尽相同。
在用户研究方面,尼尔森(Nielsen)的一些经验很值得借鉴(图1-1)。例如他们在欧美的一些问卷,从问卷设计的逻辑、采集方式、统计方法,甚至包括“埋地雷”的方法,都高出竞争对手一大截。比如只是想试试访问尼尔森在欧美的一些问卷,如果被发现是玩的心态,很快就会踩到“地雷”,被“谢谢你参与调查”拒之门外。通过后台的一些设定,尼尔森可以很快判定哪些才是真正的采集对象,而那些不认真的来访者,很快就会被发现。从整体上说,尼尔森在用户研究方面有自己的独到理解,并且已经建立了颇具特色的用户研究方法体系,其范畴已基本涵盖了新媒体的各种平台,具有很强的参照性。
图1-1 nielsen网络界面
(4)定量数据与定性数据相结合
“啤酒和尿布”是个经典的例子:沃尔玛每天最重要的事是“想尽一切办法,把货架摆好,让顾客更快地找到想要的商品,然后付费离开”。为此,他们投入了大量精力进行数据分析。沃尔玛的数据分析人员通过庞大的数据处理系统,发现一个令人倍感困惑的现象,即啤酒和尿布这两件看上去毫不相关的商品,其销售曲线惊人地相似(特别是在周末)。沃尔玛的数据分析人员在后续的定性数据研究中发现了真相——在美国一般都是男人去超市买尿布,而在周末的沃尔玛,就算买1美元的东西也可能要排半个小时的队结账,于是很多爸爸在准备结账时会顺手拿一打啤酒犒劳自己。基于这样的事实,沃尔玛开始尝试在卖场中将啤酒和尿布摆在同一区域,让年轻的父亲可以同时找到这两件商品,并迅速完成购物。这一简单的举措让沃尔玛获得了很好的销售业绩,这一案例也成为用户研究的经典案例。“啤酒”和“尿布”逐渐由一种销售方式转化为一种有关生活状态的文化仪式,成为了“爸爸们的聚会”的代名词,图1-2就是这种聚会的海报设计。
一般来说,定量数据只能告诉我们结论,而不能告诉我们背后的原因。同样,如果只看定性数据,看到的也可能只是片面现象,结论会有偏差。还有一些常见因素对结论也会造成影响。比如说只关心数据,不关心过程;只看“大数据”,不看“小数据”;只看数据表象,不看数据原因等等,这些都不可取。不过,可以肯定的是,与用户接触越多,对用户心理模型的理解就会越透彻;而对业务逻辑了解得越透彻,我们对于数据的理解就会越深入。
3.大数据
大数据其实不算是个新概念。早在2001年,就出现了关于“大数据”的定义和讨论。META集团(现为Gartner)的分析师道格·莱尼(Doug Laney)在他的一份研究报告中,将数据增长带来的挑战和机遇定义为一种“3V”模型,即数量(Volume)、速度(Velocity)和种类(Variety)的增加。虽然这一描述最先并不是用来定义大数据的,但是Gartner和包括IBM、微软在内的许多企业,在此后的10年间频繁使用这个“3V”模型来描述大数据。其中,数量意味着生成和收集大量的数据,数据规模必须庞大;速度是指大数据的时效性,数据的采集和分析等过程必须迅速及时,从而使数据的商业价值最大化;种类表示数据的类型繁多,不仅包含传统的结构化数据,更多的则是音频、视频、网页、文本等半结构和非结构化数据。
图1-2 “啤酒和尿布”的海报设计
对于大数据的描述也有一些不同的意见,在大数据运用及其研究领域极具影响力的国际数据公司(IDC)就是持不同意见的公司之一。2011年,该公司发布的报告对大数据进行了如此描述:“大数据体现了新一代的技术和架构体系,通过高速采集、发现或分析,提取大量数据的经济价值。”以此为基础,IDC将大数据技术的特点总结为4个V,即数量(Volume)——数据体量浩大,种类(Variety)——数据模态繁多,速度(Velocity)——数据生成快速,与价值(Value)——数据价值巨大而密度却很低。在价值认同的基础上,“4V”模型得到了广泛的认同。虽然“3V”模型似乎更专业化,但“4V”十分明确地提出了大数据的意义和必要性,即挖掘潜藏在数据中的巨大价值,这便是大数据最为核心的问题——如何从规模巨大、种类繁多、生成快速的数据中挖掘价值。
现在,关于大数据的定义在“4V”模型的基础上,又增加了一个V,即Veracity——数据的真实性,强调大数据中的内容与真实世界中的事物息息相关,研究大数据需要从庞大的网络数据中提取出能够解释和预测现实事件的信息。关于真实性的维度,使得大数据的人文特性开始凸显,人们不但关心数据技术本身,同时也开始关注数据与人之间真实的关联。至此,大数据定义的“5V”模型全面成型。
大数据不是一个热炒的媒体概念,而是一种切切实实的数据分析方法。就目前来看,大数据分析涉及的关键领域主要有6个:
结构化数据。结构化数据一直是传统数据分析的重要研究对象,目前主流的结构化数据管理工具,如关系型数据库等,都具有数据分析功能。
文本。文本是常用的存储文字、传递信息的方式,也是最常见的非结构化数据。
Web数据。Web技术的发展,极大地丰富了获取和交换数据的方式,Web数据高速增长,使其成为大数据的主要来源。
多媒体数据。随着通信技术的发展,图片、音频、视频等体积较大的数据,也可以被快速地传播。由于缺少文字信息,其分析方法与其他数据相比,具有独特性。
社交网络数据。社交网络数据在一定程度上反映了人类社会活动的特征,具有重要价值。
移动数据。与传统的互联网数据不同,移动数据具有明显的地理位置、用户个体特征等信息。
以上大数据分析的关键领域都与信息设计有着千丝万缕的联系。信息设计不但起着使数据可视化的作用,更重要的是,信息设计让大数据能够以更为亲切的方式呈现于人们面前。通过这种方式,大数据可以真正走下技术的神坛,与我们的日常生活紧密关联起来。我们能够找到、发现并读懂那些与我们息息相关的数据,并成为数据的忠实使用者。图1-3是“央妈”降准降息的数据新闻可视化设计,央行降准降息不但对于国家经济有着重要的影响,同时也关乎民生。如何将这一财经领域的概念诠释清楚,并让普通老百姓了解这一重要举措对自己的影响,设计师用了卡通形象和游戏的方式,让用户能够在轻松的情景下,了解信息的实质内容。
二、信息与文化
图1-3 “央妈”降准降息的数据新闻可视化设计
1.相似和差异
文化是流动的,这使得在漫长的历史岁月里,不同地区的很多事物的发展具有了某种相似性。刘易斯·芒福德在《城市发展史》一书中写道:“目前已知的最古老的城市遗址,大部分都起始于公元前3000年前的几个世纪。”如果说城市的出现时间是个巧合的话,那么文字应该更能说明问题。图1-4是不同地区远古时期的人类文字,这些文字出现的时期非常相近,在形态上同样有明显的相似性,都是以描摹周围事物作为基本的记录方式。这些证据有力地说明了文化的相似性特征。
图1-4 苏美尔楔形文字(上)、古埃及象形文字(中)和古中国甲骨文(下)
但是,文化远比我们想象的复杂。这是一个庞杂的体系,在长期的发展过程中形成了许多特定的习惯,不同文化系统存在差异。比如文字的阅读方向,中国古代汉字的书写习惯造成阅读方式是自上而下的,虽然现在我们大部分人已经习惯了从左至右的阅读方式,不过还是能够经常看到传统纵向的排版方式,这其实更多地是为了向传统致敬。当然这也成为文化归属感的心理特征之一。的确,文化可以唤醒我们对身份的认同,同时也能为有效地沟通奠定基础。信息设计作为一种沟通的艺术,对于文化相似性和差异性的理解十分重要。
美国文化心理学家尼斯比特(Richard Nisbett)认为:“西方文明建立在古希腊的传统之上,在思维方式上以亚里士多德的逻辑和分析思维为特点;而以中国为代表的东方文化则建立在深受道教和儒家思想影响的东方传统之上,在思维方式上以辩证和整体思维为主要特征。”这种思维方式的差异直接体现在绘画这一古老的艺术形式上。西方绘画大部分时间都在追求对真实物象的描摹,为了达成视觉上的真实,不少艺术家会用科学的方法来思考比例、结构等一系列问题;而中国的绘画艺术,大部分时间并不专注于存在的真实性,相反是用实践之外的观念去理解“像”与“不像”的问题。尤其是中国的文人画家,他们认为精神的真实,即“神似”才是绘画艺术的化境。我们从图1-5中可以看到东西方绘画对于同一禽类不同的描绘方式。
东西方文化的思维差异在设计范畴中也多有体现。例如中国古代城市规划多讲究“择中”“对称”,通过明确的中轴线来统领整个城市的基本布局,以体现权利和尊严;而西方城市则更多以圆形来规划布局城市建筑,市政设施和宗教场所等重要建筑一般都位于广场周围,并以广场为原点向外扩张,这一规划逻辑在现实层面的意图十分明确,那就便于施政者加强管理。图1-6显示的是同一时期中西方两座城市布局的平面图,我们能够清楚感受到规划思想的不同。
图1-5 西方绘画和中国绘画中的鹫
图1-6 中国平遥古城(左)和澳大利亚堪培拉城(右)
文化内涵是设计深层次的追求,而不是符号的堆砌和自我标榜。设计文化的特质并不能立竿见影,这需要设计师自己去体会感受不同的文化和习俗,更多地去充当倾听者而不是哗众取宠的作秀者,这样才能触摸到文化的脉搏,让设计有深度,让用户感受到更多的沟通诚意。信息设计的人文精神也由此体现。
文化是最好的沟通载体,具有人文精神的信息设计总能让人们感到亲近并增强认同度。我们可以通过对文化相似性和差异性的理解,做出最为恰当的信息设计抉择,此时文化会浓缩为一种价值判断,引导设计行为的方向。同时,信息设计也是文化传播最为直接的载体,通过以沟通为目的的设计把文化的范式与精髓传递给更多的人,让文化在碰撞中交融并和谐发展,这就是信息设计对文化的作用。
2.本土和外来
“百里不同风,千里不同俗”,地理距离是文化差异形成的一个自然条件。即使是在同一个文化圈内,也会产生不同的风俗,例如吴越文化、岭南文化、中原文化等都处于中华文化圈内,其风俗习惯却不尽相同。当今国际文化的交流日益频繁,纵观其影响,一方面,外来文化的融入可以带给本土文化更多的发展机遇;另一方面,外来文化也会对本土文化形成冲击,甚至是威胁。今天,不存在没有本土文化参与的全球化,而全球化也永远都在吸收和重塑本土文化。
从图1-7中我们不难发现,同是茶文化,中国和英国的茶文化无论是仪式还是用具都有截然的差别。英式下午茶不同于中国传统意义上的饮茶,除喝茶之外,还配有各种点心和水果。最重要的是,这样的聚会还提供给人们一个可供交流的空间。英国人将下午茶发展成一种生活习惯甚至是文化,如今在欧美依旧流行。英国茶道是与中国、日本茶道在完全不同的文化背景下发展出的茶文化,并随着殖民扩张被带到了世界各地,逐渐发展成了一种世界性的下午茶习惯。
图1-7 中国和英国的茶文化
外来文化被接受从来就不是一个一蹴而就的过程,而是需要经历一个相当长的时间,才能真正融入大众生活。这一过程可能伴随着一代甚至几代人的成长。不过,一旦被接受,就可能发展出独特的地域文化。例如中国和日本茶道本同源,但经过时间的磨砺,今天有着大不相同的内容。
信息设计如何看待本土和外来文化,的确会体现于具体的设计形式中,这些其实都是一种文化态度的表征,没有绝对的对与错。但无论采取怎样的形式,都需要我们拥有一种宽广的视野和博大的情怀,跳出文化的围篱,考虑具体实际的情境。
3.可看和不可看
“看”不单是一种感官方式,其实也是一种思维方式。更多的时候我们不是用“眼睛”去看,而是用“心”去看,用经验去观察,用文化价值观念去判断。
如今,红绿灯作为一种世界范围内通用的交通信号灯,几乎在全球每个角落都能看到它的身影。不管文化有多么地不同,面对红绿灯人们都可以做出正确的判断。其实,我们对于信息的判断是经验化的。没有人生来就知道色彩的含义,在外界的干预下,我们学会了有“识别”地“看”。这种“看”已不是简单的感官方式,而是建立在固定的模式上的“看”。在这个过程中,我们看到的信息会以经验的方式转化成意识储存在大脑中,由此也产生一个问题——当一个事物被大家熟悉和接受的时候,一个标新立异的前卫设计反而会带来诸多不便。如何在经验和创新之间抉择,也是信息设计需要面对的问题。图1-8是一组人们惯常使用的音乐播放器的图标设计,依据以往的经验,即使没有文字的辅助,我们也能猜出图标对应的功能意义,因为这些图标的含义早已约定俗成,且这种惯例可以跨越文化的障碍进行沟通,而不需要过多地修饰,便能起到很好的识别作用。“看”积累的视觉经验可以借鉴、传承,但并不是可以一成不变地借鉴,这就需要根据实际情况做出合适的分析和调整,既要考虑用户的经验因素,也要考虑信息产品本身和外部环境等因素。设计创新固然重要,但必须根据人的经验习惯来创新。
图1-8 常用的音乐播放器的图标设计
在评论艺术作品的时候,我们经常可以听到对作品和作者精神内涵的分析和探究,由此可以触及作品创作的深刻意义,而这些其实都并非是我们眼睛能直接看到的。即使我们借助高科技技术能看到更多的信息,但是物质化的内容所提供的信息始终是有限的,而主观思考却可以带来无穷的延伸空间。为了更好地了解人类的内心以及精神世界对于外部感官的影响,了解心理学对于信息设计来说是至关重要的,这样才能体会“可看”和“不可看”的真谛。
三、信息的分类与方法
1.分类、标签、关键词和属性
分类和标签(Tag)似乎总是成对出现,但在具体运用上存在差别。举例来讲,《道德情操论》这本书可以说是道德哲学著作,也可以归类到伦理学,那么这本书到底放在哪一类中更合适呢?分类很难解决这个问题,因为分类总会存在争议,这个时候标签就可以发挥让争议共存的效用。同一个事物可以有很多不同的标签,所以《道德情操论》至少可以加上哲学和伦理学两个标签。通过标签的方式很容易解决这些交叉领域的信息归属问题。
那么标签和关键词有差别吗?举例来说,一篇名为《夏天婴儿多发病的症状与解决方法》的文章,我们可以给它加上若干个标签——夏天、婴儿、病症(以及文中所涉及的具体病症名)、治疗等。这样一来,从任何一个标签我们都可以检索到这篇文章。这样的标签就不仅仅是标签了,它们还成了关键词。关键词的特性在于必然与文章内所出现的内容有着客观的联系,而不能带主观色彩。比如,同是这篇文章,关键词可以是夏天、婴儿等,却不能是“我最喜欢的文章”“非常实用的好文”这类主观描述。也就是说,标签可以主观,但是关键词一定要客观。从以上这些比较与分析中,我们可以把标签与关键词的含义及差异理解得更为清晰。
从某种意义上说,标签本身的特性就是松散而平等,如果要强行给标签再做分类,无疑又会重新回到分类的局面,也就失去了标签本身的意义。结合上文的分析,我们会发现标签更多地是供用户自己使用的一种社会化词条,而并非信息管理所使用的工具;即使使用类似于标签的形式,其实也尽量去除了主观性。所以,一些信息设计,如网站的导航设计,最终展示出来的还是分类,只是相对来说是比较灵活的分类而已。
那么到底什么才是分类呢?从字面角度来说,标签与关键词都属于名词,而分类应是动词。也就是说,分类是一种行为,它的依据是“类”,即属性。分类必须依据某类属性来进行。那么如何定义属性呢?它与标签、关键词又有何不同?属性是事物客观存在的物质状态。比如,一个显示设备的屏幕等级分辨率是4K,就不能说它的屏幕等级分辨率既是4K又是2K,这里的屏幕等级分辨率就是属性。
2.概描述和泛描述
有些文献把“Label”(标记)也翻译成了标签,那么问题就来了,“Tag”应该怎么翻译?如果“Tag”也是标签,那么它与“Label”的区别又是什么呢?这真是很难回答的问题,因为语言本身的模糊性,绝对精准的翻译总是可望而不可即。可以说,关键词由编辑整理提取时,信息检索的质量较高;标签由用户自由添加时,信息检索的质量就相对差一些。
为什么要用标签,是因为分类不能满足用户个性化描述的需求吗?那么哪些信息需要进行个性化描述?比如一篇文章、一张图片,N个用户看可能会有N个关键词,这种情况使用标签就会合适。而书就不太适合,因为作者、出版社、出版年等这些重要信息已经结构化,并且也符合绝大多数用户的心智模型,因此使用专门的分类法就会比较容易操作。
把概念放开了想,对信息的所有描述其实也都可以叫标签、关键词、标记、分类,但这些说法模糊且不严谨,是不是应该有更好的定义?迄今为止,比较容易接受的答案就是概描述和泛描述。概描述侧重信息内容本身,而泛描述则侧重信息的类别及其与他者的相关性。所以,标签也好,关键词也好,其实叫什么都不重要,只需要将两个关系层次定义清楚,即可解决问题。如果从概描述和泛描述的观念出发,我们会发现标签和标记之间有3个显著差异:
标记是本身的,标签是附加的;
标记强调的是一种标志,标签强调的是一种记号;
标记标明信息的归属,标签用于区别信息之间的差异。
从信息检索的角度看,不管是概描述还是泛描述,都可以提升信息的检索效率。尤其跨数据类型的泛描述,是对内容整合的良好补充。在某些人工智能的搜索引擎里,泛描述还可以帮助机器学习,提升搜索的命中率。
概描述和泛描述是解决信息分类难题的一个普遍认同的方法,同时对信息的形态特性也会产生深远的影响。
我们在信息设计时,经常费尽心思地思考如何描述某个产品的功能,以便让用户更容易接受。要么更准确,要么更通俗,前者的作用是紧紧抓住核心用户群,后者则是为了扩充用户群的容量。如果产品主要针对高级用户,那么就需要准确和专业的描述,这样就需要强化术语;如果主要是想扩大用户覆盖群或是初级用户,那么就需要清晰而通俗的描述,尽量避免使用术语。
从实践层面说,同一产品要兼顾两类用户并不现实,常见的处理方法就是分版本。当然,版本名称的叫法还是回到了“描述”这个话题。一般来说,通用的成体系的对层级的划分主要有初级、中级、高级三类,但我们完全可以结合业务类型来“定制”更为动人的描述,比如淘宝旺铺的初级版叫作“创业扶持版”,就是一个创意点。在很多情况下,如果描述合乎用户的实际情况,就能很直接、有力地打动用户,收到积极的效果。