1.3 数据可视化的研发
1.3.1 学术机构
可视化领域的学者在北美洲较为集中,欧洲次之。分国家来看,顶尖学者分布在38个不同的国家,美国东部和西部相对集中,其次是中国,欧洲主要以德国、英国和法国为主。2008年以后,国内知名大学纷纷组建了可视化研究团队,国内学术界开始重点关注可视化方面的研究。AMiner提取了2014~2018年可视化领域顶级学术会议(IEEE VIS年会)论文中所有学者的信息,从中选出了排名前1 000位活跃学者(称为Top学者),并对全球可视化领域Top学者所属机构进行了统计(见图1-9)。清华大学为亚洲国家中唯一位列Top10的机构[3]。
图1-9 全球可视化领域Top学者所属机构分布统计
IEEE VIS是由电气与电子工程师协会(IEEE)旗下的可视化和图形技术专委会(IEEE VGTC)主办的在可视化领域最具权威的国际性学术会议,是可视化与可视化分析的理论、方法和应用发展的首要论坛。会议召集学术界、工业界、政府的研究人员和从业人员,致力于探索和交流可视化的理论、方法、应用和分析。IEEE VIS每年10月份在美国的某一城市举办,最近几年注册并参加会议的人员维持在1 000人左右。
可视化领域的顶级期刊是IEEE Transactions on Visualization and Computer Graphics,即IEEE TVCG[1]。IEEE TVCG发表计算机图形学、信息与科学可视化、视觉分析、虚拟与增强现实等相关学科的论文,主要集中在理论、算法、方法论、人机交互技术、系统、软件、硬件等领域,以及在这些领域的应用。
1.3.2 业界机构
国际知名公司,如谷歌、亚马逊、微软、Uber等,它们在开发新的可视化技术方面做出了巨大努力,并在国家安全、科学研究、数据信息、金融和智慧城市等领域发挥了重要作用。例如,微软公司开发的产品Power BI,将人工智能技术与可视化相结合,大大提高了商务智能中的可视化分析水平[9]。
国内较为领先的科技公司,如阿里巴巴,为解决行业应用中的实际问题,早在2011年就开始建立可视化团队。现如今,阿里巴巴集团、阿里云、蚂蚁集团、华为、百度、360等都设立了多支专攻可视化的研发团队,业界应用水平不断提升。
1.3.3 应用领域
随着数据资源的丰富,大数据技术的发展,数据可视化应用领域不断扩展,在金融、工业、农业、医学、教育、商务等领域都有较多应用。
1.数据可视化在金融业中的应用
随着“互联网+金融”的不断发展,市场形势不断变化,金融业面临诸多挑战。通过使用数据可视化技术,企业可以动态掌握金融业务的实时变化,如对信贷金融和客户数据进行监管,对企业业务进行实时监控,加强市场管理;还可以通过多维数据的分析和挖掘,指导企业科学决策,降低风险[10]。
2.数据可视化在工业中的应用
随着智能技术的发展,智能硬件发展需求增加,智能硬件领域延伸到电视、家居、汽车、医疗、玩具、机器人、交通等多领域。通过可视化呈现智能硬件采集的数据,可以提升智能设备的使用效率,提升用户满意度,提高智能技术和设备的附加值[10]。
3.数据可视化在农业中的应用
数据可视化手段也开始被用于农业现代化以促进农业的管理与发展。一是对农产品生长过程的监控数据进行可视化,并将农产品生长数据动态展示给消费者。二是对农产品安全领域中农药化学物残留检测数据的可视化,用于多维度、多尺度的对比分析,如结合多种最高残留限量(MRL)进行分类统计,将多重放射环与地图结合实现地域维度上的数据可视化对比,对农药化学物残留检测数据的时序分组可视化[11]。
4.数据可视化在医学中的应用
数据可视化在医学中的应用有多方面。医疗物资管理的数据可视化可以辅助医院进行物资的动态调配和科学管理。医学影像的数据可视化,如CT等图像,可以辅助医生进行病症和病灶分析,也可以辅助医生进行一些建模分析,如外科手术的精确建模,通过三维图像和数据输出,辅助医生进行外科手术。医学研究的数据可视化可以增强疾病防控、提高流行病预测和分析能力。
5.数据可视化在教育中的应用
计算机辅助教学不断深入,数据可视化应用逐渐成熟,一些可视化的多媒体教学资源越来越丰富,这些多媒体可以将被感知、被认知、被想象、被推理的事物及变化形式用仿真化的方式呈现。在教学中,数据可视化可以帮助学生更好地进行知识与记忆的关联、知识与知识之间的关联,增强学习兴趣,提高认知效率,减少信息损耗[10]。
6.数据可视化在商务中的应用
数据可视化在商务中的应用广泛,传统商务中的报表可视化存在已久,而随着电子商务的发展,电商领域中的数据可视化应用越来越广。对内可以进行客户成像管理,挖掘客户资源,提升客户关系管理、营销管理和销售绩效管理水平;对外可以进行企业和服务商之间的竞争分析,加强战略管理能力,提升企业竞争力[12]。
7.数据可视化在其他领域中的应用
数据可视化还可以应用到社区管理、园区管理、输电管理、水务管理、工商税务、交通运输、旅游服务、卫星遥感、新闻传播、舆情管理、科学研究等诸多领域中。事实上,只要有数据产生、处理和输出的领域,就有数据可视化的需求,相比之下,只是应用的深度和广度不同。
1.3.4 数据可视化的研发挑战
可视化的理念伴随着形象思维、图形图像、动画等方法不断发展而演化。现代数据可视化是计算机硬件和计算机可视化方法发展到一定阶段的新兴技术。数据可视化的研究实质仍旧是两个方面:理解和呈现。理解数据,找到连接可视化的通道,即对数据建模;理解可视化,即找到将建模结果传递给受众的方式。呈现,即找到合适的方法增强认知与感知,增强可视化与数据之间的联系[5]。
1.数据挑战
数据可视化的对象是数据,高质量的数据可视化依靠高质量数据支撑。因此,高质量的数据变得更加重要。随着大数据时代数据确权和隐私保护限制,不是所有数据都能被使用或被完全透明地使用,这在一定程度上限制了数据集的完整性和可用性,进而影响数据可视化的效果。
2.算力挑战
在大数据时代,随着数据量呈指数级增加,计算力的重要性越发突出。面向大数据的数据可视化,都需要计算力作为基础能力进行支撑,它无时无刻不在推动数字经济的发展。尽管如今的算法效率不断提高、芯片技术高度发达,但依然面临着算力稀缺的问题。除了传统意义上的存储资源的限制,数据可视化还须同步考虑传输时间等限制。
3.算法挑战
可视化研制者往往执行于像素之外,屏幕的分辨率已经不能同时显示所有要表达的信息,即有限的像素如何被庞大的数据资源使用?这就需要有合理的算法进行连接和分配,平衡显示代价和可视效率效果。
4.认知挑战
尽管可视化充分利用人类视觉的感知能力,但人类大脑对实物的记忆终究是不可见的,而且人的记忆容量、认知能力、关注力是有限的。因此,在强算力和算法保障的前提下,认知也会降低或减弱可视化感知,在数据可视化算法设计时也需考虑人的认知局限性。