平行坐标轴图(Parallel coordinate plot),也有称轮廓图,是一种分析和展示多元数据的常用方法。
看似狂拽酷炫,但其原理却很简单。平行坐标轴图这里可以简单理解为将每列数据以散点画在一个纵坐标轴上,然后将这些点用直接连起来,画法有点类似箱型图。注意,平行坐标轴图组与组的顺序很重要。
今天,在介绍平行坐标轴图绘制的同时,也介绍图表展示时的“再分组“。
数据使用R中的 iris(鸢尾)数据,该数据与Origin示例中的数据完全一样,很容易获得,这里就不上传了。由于每列数据(3个品种的萼片长度,萼片宽度,花瓣长度和花瓣宽度)的尺度范围不一样,这里需对数据标准化。标准化的方法很简单,如下,最终,让每列最大的数据处于[0-1]的范围。
如果不用3种颜色区分3个品种(再分组),用Excel的折线图也能实现平行坐标轴图绘制。Origin画法类似,通过Plot /Line+Symbol/Line Series ,Add数据后,点OK即可。得到的初始图如下。
接下来删掉图例和纵坐标轴,双击图表,将 Symbol点的大小改为1,然后按品种(Species 列的数据)更改连线的颜色,实现“再分组”,方法如下。
同上,接着在Color List 点小黑三角更改线的颜色组合,方法见下图。
然后,添加新的图例,方法如下图。
最后,在刻度处“手动”画垂直的直线,直线的“位置数值”为横坐标的默认值,这里依次为1,2,3,4,方法如下图。
最终的绘制结果如下图,当然也可进一步美化。
当然用R包GGally 绘制就非常简单了,且可选择多种数据标准化的方法,代码如下。
绘制结果如下图:
当然,还有很多工具方法可以绘制平行坐标轴图,如封面图是使用Sliver绘制的(http://www.sliversoftware.com/features.htm),理解了原理之后,再使用这些工具自会得心应手。
今天的内容就到这里啦~
联系客服