桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”。
桑基图最明显的特征就是,始末端的分支宽度总和相等,即所有主支宽度的总和应与所有分出去的分支宽度的总和相等,保持能量的平衡。
以下这些都是常见的桑基图,以往生成这样的桑基图可能需要掌握R\Python等数据科学编程工具,现在借助Data Analytics这样的BI工具,只需简单拖拽就能迅速生成。
不知道大家是否有印象,在DataHunter之前的推文中,我们也简单生成过下面的桑基图。
现在桑基图的应用范围已经愈加广泛,除了在工业制图方面,在各种数据新闻中总总能看到它们的身影,相较于普通的桑基图,数据新闻中的桑基图往往定制化痕迹更明显。
例1:温室气体排放“桑基图”
例2:全球互联网流量流程图
桑基图的适用场景?
作为一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小。在互联网领域,桑基图主要用于用户流量等数据可视化分析,一个非常典型的场景是电商分析客户从进入商品详情、加入购物车、下单、付款、收货流程的数据流量。除此之外,桑基图在销售、财务等领域也有应用。
如何快速制作桑基图?
场景还原:某公司销售主管想查看09年-12年之间,销售额与运输方式、销售区域等之间的具体关系。
如果借助散点图,则只能查看相关性却看不出销售额的具体流动;
如果借助双轴图等,则在展现维度上会受到限制;
综合考虑,最终决定使用桑基图来展现销售额与各种维度之间的流动关系。
1、数据准备:将Demo数据通过工作表上传到Data Analytics
2、点击新建看板,然后进入图表编辑页面。拖入2个以上维度和度量到相应位置生成图表。
以下图为例,我们将订单日期、运输方式、区域拖入维度,销售额拖入度量,一个简单的桑基图就生成了,鼠标悬浮到相关位置,还能查看具体数据。
通过此图可以回答之前场景中提出的问题,观察09年-12年之间销售额在省份、运输方式以及销售区域之间的流动关系:
a.火车和大卡承担了这四年中主要的商品运输而且比例相对稳定;
b.华南地区的销售贡献量稳居第一,华北、华东和东北紧随其后;
在此基础上,还能根据需要增加维度,比如下图加入了“订单等级”,可以发现中级的订单贡献了主要的销售额。
也可以配置相关颜色
最后提醒大家,桑基图是特定场景下呈现流量关系与结构对比所使用的,不要因为这种图表很炫酷就乱用哦,数据可视化的要义很重要的一条就是,适当的场景使用合适的图表。
作者:DataHunter小数
链接:https://www.jianshu.com/p/3fe959e9bcc7