打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
数据可视化的十条原则

所谓可视化,就是用图形来显示数据的过程。

这个过程没有标准,也难以自动化,同一数据有不同的图形化方式:散点图、线条图、柱状图和饼图等等。且同样的数据、同样类型的图形,不同的人看也会得到不同的结果。

因此,一个更科学的可视化定义也许是:人与数据之间的图形化接口

这里不对这个接口做更详细的解释,而是通过介绍一套基本的原则,来提高数据可视化的设计,避免一些常见的可视化缺陷。

1、了解你的观众

了解你的观众(Know your audience)。在可视化设计的初期,首先要明确可视化结果的受众。

如果你做的图是给自己或合作同伴看,那么就可以省略一些步骤,因为你们都知道这张图的背景以及所要表达的信息;但如果你打算把这张图发表到科学期刊上,那么就需要确认这张图是否正确、是否清晰、是否无歧义、是否包含了期望传递的所有信息。

如果是为了向学生解释一个概念,则必须添加额外的信息,确保这个概念能够被学生充分理解;对于普通大众来说,也许是最困难的,你需要设计得尽可能简单易懂,只展示最重要的那部分。

比如下面这张展示男女不同癌症原因的人数对比。中间的标签为癌症的原因,左右两侧分别表示对应的女士/男士的癌症人数。这种布局可以更直观的看到男/女不同癌症的人数对比。

2、明确需要传递的信息

明确需要传递的信息(Identify your message)。用一个图形用来展示一个想法、一些事实或结果,这些信息如果用文字来描述也许很长或难以描述。因此,明确这张图形的作用很重要,明确期望传递的信息,才能找到对应的最佳的可视化方法。

就如同写文章,只有明确了文章的主旨和中心思想,才会开始打磨每段话、每个句子、每个单词。

3、调整图形适配不同设备

调整图形适配不同设备(Adapt the figure to the support medium)。你的图形可能会在不同的设备上展示,如海报、电脑、监视器、投影仪,或就在一张纸上。每一个设备都代表着不同的尺寸、不同的分辨率,以及不同的查看和交互方式。

比如在一个口头报告中,一张图显示的时间有限,观众必须在短时间内理解图的内容,同时还要聆听你的说明。因此,这个张图必须简洁、突出重要信息。同时也需要注意的是,观众是从远处来看这张图,因此,图上的元素要尽可能突出,粗线条、大的点、对比强烈的颜色等等。

但如果是在期刊论文上,情况则完全不同。观众可以想看多久看多久。这意味着图上可以添加更多的信息。如果是在电脑上查看,图形还可以被拖动、放大来查看。

因此,一张图形需要适配不同的显示设备。你应该抛弃那种直接从文章中截图放到PPT上的做法。比如下面这张图。左边适合放到文章里,而右边适合做报告时放到PPT里。

4、必须添加标题

必须添加标题(Captions are not optional)。不管是描述一个实验步骤、介绍一个新模型,或展示一些结果,这张图形必须有标题。不要希望观众只靠图形就能猜出这张图所要表达的含义。

5、不要相信软件的默认设置

不要相信软件的默认设置(Do not trust the defaults)。任何的绘图库或软件都会使用一组默认设置,包括字形、颜色、样式、大小、刻度、标记等等。事实上,这些默认设置在软件中(Matlab、matplotlib、Excel)都可以修改。

这些默认的设置适用于任何图形,换句话说,对每个特定的图形来说都不是最优的。因此,需要进行一些调整。如下图所示,左图是默认的设置,右图则进行了调整,哪个图更直观呢?

6、有效使用颜色

有效使用颜色(Use color effectively)。颜色是可视化图形的一个重要维度。

颜色可以使图形锦上添花,也可能会使图形杂乱无章。

如果决定使用颜色,就需要慎重考虑使用哪种颜色,在哪里使用颜色。如要突出一些元素,那么就可以单独为这个元素上色,而保持其他元素为灰色或黑色。

切忌使用过多相似的颜色,使人难以辨别颜色的差异。

7、不要误导读者

不要误导读者(Do not mislead the reader)。区分科学图形和艺术图形的关键点在于其所关联的数据是否真实、客观。一个科学的图形,其所要表达的数据,所用的标题、标签、刻度都应符合常识,避免无意中误导了观众。

如下图所示,有四个数据:30,20,15,10,上面是使用黑色圆的面积来代表不同的数据大小,下面是使用红色圆的半径来代表不同的数据大小。使用红色圆的半径来表示大小很容易让人产生误解。

做出图形后,请向你周围的同事展示、解释、交流,倾听他们的反馈。

8、避免图形堆砌

避免图形堆砌(Avoid chartjunk)。Chartjunk就是一张图里有太多不必要或令人疑惑的元素,包括使用太多的颜色、标记、背景色、网格线等等。

如下图所示,左面将7组数据用不同的颜色画到一张图里,有效信息都混杂到了一起,非常糟糕;而右面将7组数据用7个图分别突出显示,一目了然。

9、信息重于漂亮

信息重于漂亮(Message trumps beauty)。可视化在科研上的应用已经由来已久,且每个特定的科研领域都形成了一套可视化的最佳方法或标准。直接套用这些最佳标准省时省力。

如果需要设计一个全新的图时,最好首先浏览相关的科学文献,如果能找到相似的图形那样最好,如果需要你自行设计或从网页上浏览寻找灵感,需要注意的是:科学、设计和艺术的边界正变得越来越模糊,即使某些图形非常漂亮,也要注意审查它用于科研可视化是否合适,对于科研来说,内容重于形式,信息重于漂亮。

10、使用合适的工具

使用合适的工具(Get the right tool)。在制作图形时,有很多工具可以使用。重要的是根据你想要表达的内容,找到最合适的工具用来制作可视化的图形。

翻译自《Ten Simple Rules for Better Figures》- Nicolas P. Rougier。

私信“数据可视化的十条原则”获取英文原文下载链接。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
GLAD 原则
EXCEL数据之美:带你走进数据可视化
《数据可视化基础》:使用颜色的常见陷阱
11-数据可视化应该避免的误区
解锁制作图表新姿势,满足欲求不满的你!
如何实现大数据可视化——大数据可视化的六步方法论
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服