“杂乱无章和混乱无序并不是数据的属性 —— 它们是设计的缺陷。” —— 爱德华.塔夫特
什么是数据可视化
迈克尔.弗兰德利将数据可视化定义为:“以某种示意图的形式抽象出来的信息,包括信息单位的属性或变量。”换句话说,这是一种通过视觉连贯地传达定量内容的方式。数据属性不同,其表达方式也多种多样,例如折线图、柱状图、饼图、散点图或者映射。
对于图形设计师来说,当创建这些可视化图形时,通过最佳方式呈现数据集,并坚持采用数据可视化的最佳范例是非常重要的。特别是需要处理非常庞大的数据集的时候,开发一种内聚性的格式,是创建实用和具有视觉吸引力的可视化图形的关键所在。
《华尔街日报》美国失业情况的可视化数据
为什么要使用可视化数据
IBM表示,每天生成的数据量是2.5万亿字节。研究员安德鲁.迈克菲和麻省理工学院(MIT)教授埃里克.布林约尔松指出:“现在每秒钟通过互联网的数据,比20年前整个互联网上存储的数据还要多。”
随着越来越多的电子设备将世界互联,数据量将继续呈指数级增长。IDC预测,到了2025年,数据量将达到163万亿字节。
人脑很难理解这些数据 —— 事实上,如果不进行某种类比或者抽象,人脑是很难理解大于5的数字的。可视化数据设计人员在创建这种抽象上扮演着重要角色。
毕竟,如果大数据不能以有效的方式被理解和消费,它就是无意义的。这就是为什么数据可视化在经济、科学技术、医疗保健和人类服务等各个领域发挥着重要作用。通过将复杂的数据和其他碎片化信息转化为图表,其要表达的含义也就变得易于理解和采用了。
采用可视化数据的时机
由于数据量较大时很难探寻其蕴含的意义,而很多有用的数据集包含着大量有价值的数据,因此可视化数据已经成为了决策者一个很重要的资源。为了利用这些数据,许多企业看到了可视化数据在清晰且有效地理解重要信息方面的价值,即协助决策者弄明白难以理解的概念,识别新的模式,得出以数据为驱动的见解,以便做出更好的决策。
无论何时,在数据可视化方面投入资源都是值得的,因为不论是在商业、科技、科学还是其他领域,理解大型数据集对于作出明智的决策是非常有必要的。清晰的可视化可以使人们更容易理解复杂的数据,因此也更容易有针对性地采取行动。
原则
明确目标
可视化数据应该对重要的战略问题予以解答,提供真正的价值并协助解决真正的问题。例如,其可以被用于跟踪性能,监控用户行为和度量流程的有效性。对于数据可视化项目,需要在一开始明确定义目标和优先级,这将使最终的结果更加具有价值,以免因创建不必要的可视化数据而浪费时间。
了解受众
如果可视化数据不是为与目标受众进行明确的沟通而设计的,那么其将是没有意义的。设计的可视化数据应该与受众的专长相匹配,并允许受众轻松地查看和处理数据,也要考虑受众对数据呈现的基本原理的熟悉程度,以及他们是否可能具有STEM领域的背景。在这个领域,图表和图形更有可能被定期查看。
使用可视化功能来正确显示数据
图表的种类多种多样。决定以哪种最优方式对数据进行可视化的本身就是一门艺术。 正确的图表不仅可以使数据更易于理解,还能以最准确的角度去呈现它。为了做出正确的决定,你需要考虑传递哪种类型的数据,以及这些数据将被传递给谁。
下面是用于数据可视化的最流行的图表类型
折线图:折线图用于比较随时间变化的值,并且非常适合用来显示明显和细微的变化。其还可用于多组数据的比较。
(来源:UNEP)
柱状图:柱状图用来比较来自几个类别的定量数据。它们也可以用来跟踪变量随时间的变化,但是最好用于变量的变化具有重要意义的时候。
(来源:我们的数据世界)
散点图:散点图用于显示数据集中两个变量的值,非常适合用于探索两个数据集之间的关系。
(来源:我们的数据世界)
饼状图:饼状图用于展示整体中每一部分之间的关系,不能被用来展示指标随时间的变化趋势。
保持条理和连贯性
将大数据集进行可视化时,连贯性尤为重要。具有连贯性的设计将淡化背景信息,使用户能够轻松地处理信息。最好的可视化是帮助受众通过展示的数据得出结论,而不是流于表面的新颖,或者通过其他方式吸引受众的注意力。其只是以最好的方式展示数据。
通过创建一个数据层次结构,可以以一种与决策者相关的方式显示各种数据点。你可以将数据从大到小进行排序,以强调最大值。或者以突出的方式显示对用户更重要的类别。
即使是数据的显示顺序,使用的颜色(例如使用鲜明的颜色表示重要的数据点,或者灰色表示基线数据),图表中各种元素的大小(就像扩大饼状图的某些部分)也可以帮助用户更容易地理解数据。在使用这些技巧的时候,要注意不要在不存在偏差的地方制造偏差。
交互式可视化数据也可以很好地帮助人们解释数据。
使可视化数据具有包容性
颜色被广泛地用作表示和区分信息的一种方式。根据最近由赛富时主导的一项研究表明,其也是用户决策中的一个关键因素。
他们分析了人们对于在图表中使用不同颜色组合的反应,假定他们更偏爱具有微妙颜色变化的调色盘,因为这样更具有美学上的吸引力。
然而,研究人员发现,尽管这些图表很吸引人,但是调色盘的微小差别使图表变得更难分析和获得深刻见解。这完全违背了创建可视化数据的目的。
如果图表的颜色相似,对比度较低,一般人会很难读懂,这对于具有视觉障碍的人来说就更难懂了,这些人在总人口中也占据了相当大的比例。根据世界卫生组织的统计,约有2.53亿人患有视觉障碍症。
幸运的是,患有视觉障碍的人们可以借助一些工具来检查如何将图像进行可视化,例如Photoshop和Illustrator中的色盲打样。其他的一些方面,例如使用足够大的字体,以及字体和背景间适当的对比度也是有帮助的。
如果仿真工具显示了调色板的问题,可采用一些技术来提高图像的可读性:
使用对比度高的颜色。
补充使用带有图案或者纹理的颜色来传达不同类型的信息。
使用文本或者图标来标记元素。
即使数据可视化采用了比例模型,也可以在每个步骤中采用鲜明的颜色对比。上图的交互版本包含了用户在每个国家停留时的标签。(来源:我们的数据世界)
字体的选择会影响文本的易读性,增强或者减弱文本的原意。因此,最好避免显示字体,坚持使用基本的衬线体或者无衬线字体。
确保可视化数据的字体大小与其介质适配。Smashing杂志建议”在现代网站设计中,16个像素应该是文案主体的最小尺寸。”
不要歪曲数据
一个很棒的可视化数据应该能够清楚地阐述图表背后的意义,避免产生歧义,应避免使用不能准确表述数据集的可视图像,例如3D饼状图。
像这样的3D饼状图很难辨别每个切片占据的比例。(由PSD图形提供)
可视化数据可以在不歪曲数据本身的条件下,引导受众得出一定结论。这对于设计公共消费类的信息图表尤其有用,通常创建这些图表是为了支持特定的结论,而不是仅仅为了传递数据。像颜色的选择和指定特定的数据点,可以在不产生歧义图表(这可能会使设计师的可信度受到质疑)的条件下,达到上述目的。
糟糕的数据可视化例子
Y轴不从0开始会使数据看起来比实际值有更大的增益。这使得可视化数据具有误导性,并且没有使所呈现的数据变得清晰。
这是另一个Y轴未从0开始的例子,其结果的显示方式产生了偏差。
上图主导品牌的条形图在规模上具有误导性,因为该图表中没有Y轴。尽管只有不到1%的细微差距,但是图表中的蓝色条柱还是被过度放大了。
当苹果公司试图证明新的iPad延长了70%的寿命时,他们增加了70%的高度,同时也增大了整体的尺寸,使得电池看起来比之前的iPad电池大得多。(朝露投稿)
好的数据可视化示例
像上图中的条形图是一种很好的显示数据之间差异的方式,提高的颜色对比度也使视觉障碍用户更容易辨别上述图表。 (由503020提供)
这个销售仪表盘采用了两种可视化格式,以一目了然的格式显示相关数据。数据也进行了很好的标记,进一步明确了相关含义。(由巴格斯.菲克里提供)
将简洁、清晰的设计,与由简单图表呈现的易于理解的可视化数据结合起来,可以带来很好的用户体验。(由米克罗斯.飞利浦提供)
谷歌的用户洞察在交互式数据分析套件方面做得很好,这些套件使数据更加易于理解。
结论
良好的可视化数据应该能够透过图表,清晰有效地表达数据集的含义。最好的可视化可以数据变得一目了然。通过可视化获取复杂信息,并将信息进行分解,使目标受众能够轻松地理解信息,并依此做出决策。
正如爱德华.R.塔夫特所说:“设计的精髓在于能多有效地帮助人们理解内容,而不是有多前卫。”数据可视化尤其要遵循这一思想。设计的目的是增强对数据本身的理解,而不是将受众的注意力引向设计本身。
牢记这些数据可视化的最佳实践例子,可以使对用户真正有用的信息图表的设计过程变得简单化。
•••
延伸阅读
数据可视化的启示
仪表盘设计——提升您的分析能力
仪表盘设计——注意事项和最佳实例
展示设计和视觉表达的艺术
了解基础知识
什么是数据可视化?为什么它很重要?
数据可视化可以看作一种可视化交流方式,其可以提供一种连贯的方式来表达包括大数据集在内的定量内容。数据可视化使复杂的数据变得易于接受、理解和使用。
颜色对比意味着什么?
对比色在亮度或者色调上有显著差异,使得它们易于区分。例如,白色和黑色在亮度光谱的两端,因此对比度较高。蓝色和橙色在比色环相对的两侧,同样具有较高的对比度。
为什么对于网站来说,色彩对比很重要?
网站足够的颜色对比度能够让用户更容易区分对象或者设计元素。适当的颜色对比也是创建视觉障碍用户可以访问的网站的关键所在。
译文出处:https://www.zcfy.cc/article/data-visualization-best-practices-and-foundations