1.2 数据可视化的作用与意义
1.2.1 数据可视化的作用
随着大数据时代的到来,可视化技术越来越多地被人们用于理解和分析数据,挖掘数据背后的奥秘。可视化技术将符号描述转变成几何描述,从而使研究者能够观察到所期望的仿真和计算结果。相比传统的用表格或文档展现数据的方式,数据可视化能以更加直观的方式展现数据,使数据更加客观、更具说服力。此外,可视化技术提供了将不可见转化为可见的方法,丰富了科学发现的过程,促进了对未知事物的领悟。可视化的作用体现在多个方面,如揭示规律和关系,形成论点或主见,观察事物演化的趋势,总结或积聚数据,了解真相,追求真理,传播知识,探索性数据分析等。从宏观角度看,可视化包括三大功能,即信息记录,支持对信息的推理和分析,以及信息传播与协同。数据可视化的作用是由看见物体到获取知识。对于复杂、大尺度的数据,已有的统计分析或数据挖掘方法往往是对数据的简化和抽象,隐藏了数据集真实的结构,而数据可视化则可还原乃至增强数据中的全局结构和具体细节。当前,数据可视化经常会陷入两个误区:一是为了实现其获取知识的功能而令人感到枯燥乏味;二是为了画面美观而采用复杂的图形。如果将数据可视化看成艺术创作过程,数据可视化需要做到两个平衡。
一方面,数据可视化要达到真、善、美的平衡。信息设计的先驱者,耶鲁大学统计学和政治学教授爱德华·塔夫特(Edward Tufte)认为,好的可视化作品与好的翻译一样,应该做到三个标准:信、达、雅。简单地说就是:一是真实地表达丰富的数据,避免扭曲数据(Avoid distorting data);二是目的清晰,发人深省,激发观察者去比较不同的数据内容(Serve a clear purpose and encourage the eye to compare);三是有美感(Aesthetic)。
另一方面,数据可视化要实现设计与功能之间的平衡,有效地挖掘、传播与沟通数据中所蕴涵的信息与知识。
具体而言,数据可视化的主要作用包括数据记录和表达、数据操作及数据分析3个方面,这也是以可视化技术支持计算机辅助数据认知的3个基本阶段。
1.数据记录和表达
数据表达是通过计算机图形图像等技术手段更加友好地展示数据信息,方便人们阅读、理解和运用数据的过程。人们利用视觉获取的信息量远远比别的感官要多得多。人类的知识中,有80%以上的信息通过视觉获得。所以,数据可视化可以帮助人们更好地传递信息,毕竟人类对视觉获取的信息比较容易。人类的记忆能力是有限的,单纯地记忆数据特征对人类来说也是不小的挑战。将数据总结到一张图表中,通过图像记忆,能更好地帮助人们记忆。常见的数据表达形式包括文本、图表、图像、二维图形、三维模型、网络图、树结构、符号和电子地图等。借助于有效的图形展示工具,数据可视化能够在小空间呈现大规模数据。
2.数据操作
数据操作是以计算机提供的界面、接口、协议等条件为基础完成人与数据的交互需求,数据操作需要友好便捷的人机交互技术、标准化的接口和通信协议来支持完成对多数据集的集中或分布式操作。当前,基于可视化的人机交互技术发展迅猛,包括自然交互、可触摸、自适应界面和情境感知等在内的多种新技术极大地丰富了数据操作的方式。
3.数据分析
数据分析是通过数据计算获得多维、多源、异构和海量数据所隐含信息的核心手段,它是数据存储、数据转换、数据计算和数据可视化的综合应用。数据可视化作为数据分析的最终环节,直接影响着人们对数据的认知和使用。数据可视化能够帮助人们对数据有更加全面的认识。优化、易懂的可视化结果有助于人们进行信息交互、推理和分析,方便人们对相关数据进行协同分析,也可加速信息和知识的传播。另外,数据可视化可以有效表达数据的各种特征,辅助人们推理和分析数据背后的客观规律,进而获得相关知识,提供人们理解、认识和利用数据的能力。
交互智能可视化分析。借助可视化手段将人与机器智能有机结合,形成沉浸式分析环境可有效提升数据关联分析的效率。可视化能够使人深入了解数据分析和查询之间的关联性。可视化使得城市等复杂空间的智能化建立统一环境和可计算模型成为可能。