BI报表、运营同学的汇报报告中数据图表大多为 表格、折线图、柱状图和饼图,但是实际上还有很多具有代表性的可视化图表,因此将对常见的可视化图表进行介绍,希望这些图表可视化方法能够更好的提供数据的可用性。
导语
数据是我们在数据分析工作中最坚实的朋友,但是由于人类都是视觉动物,从一行行、一列列的详细的数据中往往无法快速的提取到我们需要的信息,因此,数据可视化就是我们和数据交朋友的最好工具。
我们可以这样理解数据可视化:
借助于图形化手段,清晰有效地传达与沟通信息
在这篇文章开始之前,我们首先需要知道下面这几件事情:
1、数据是会骗人的
举个🌰,最常见的“骗子数据”:平均值、中位数
现实生活中,我们经常能看见上面这样的新闻,但是大家在看到之后往往会感叹,“看来自己拖后腿了,原来自己是中下游水平!!!!”
平均数的数值是没有错的,但是我们真的是在中下游吗?事实上,很有可能是这样的,收入非常高的少数人群,明显的拉高了平均数。那我们看什么数据能够真正知道,大家的收入一般是在什么水平呢,中位数往往是不错的选择。
中位数:按顺序排列的一组数据中居于中间位置的数
2、数据可视化也是会骗人的
引用:数据分析会骗人么? - 邹昕的回答 - 知乎 https://www.zhihu.com/question/22184006/answer/143647681
这个回答中有一些常见的可视化骗局的图表和分析,就不再赘述了,有兴趣的朋友可以自己去看一看。
3、数据可视化内容不是越丰富越好
数据可视化的本质 是从明细数据中提取出一些信息展现出来,但并不是全部信息。
同时,不同的数据可视化图表都有其对应的数据和可视化目标。
所以,数据可视化的过程是:
确定可视化的目的-->确定使用的可视化图表类型 --> 处理原始数据,满足可视化要求 --> 可视化
一、图表可视化决策树
可视化图表根据其作用可以分成四个大类:比较、构成、描述和序列。各类型的可视化图表见下图:
↑
接下来将从 图表的作用、原始数据格式要求、可视化效果等方面逐个介绍比较有代表性的可视化图表。
本篇关注 比较、构成 这两类图表,序列、描述类图表将在下篇中进行介绍。
二、比较类可视化图表(比较类是重点)
1、油量表、进度图 ⭐️⭐️
作用:展示进度情况,比较进度和目标
数据格式和可视化效果:
2、柱图、条形图 ⭐️⭐️⭐️⭐️⭐️
作用:展示不同项目的指标,进行比较(常用于分类较少的数据),当前使用较为广泛
数据格式和可视化效果:
3、雷达图 ⭐️
作用:展示不同项目的多个维度指标的指标值
数据格式和可视化效果:
下图中的项目指的是一级市场和二级市场,图中比较了他们在各个地区的市场销售情况
4、词云图 ⭐️
作用:以文字的大小展示不同项目的指标大小情况,无法获得准确数值
数据格式和可视化效果:
5、散点图 ⭐️⭐️⭐️⭐️
作用:比较多个项目的2-3个指标,可以直观的从图上看出效果
数据格式和可视化:
图中的横轴代表销售额,纵轴代表利润,散点的大小代表订单数。
三、构成类可视化图表
构成类图表中,最常使用的就是饼图,其他图表(堆积图、瀑布图)使用不多。
1、饼图 ⭐️⭐️⭐️⭐️⭐️
相关图表:饼图、环形图、南丁格尔玫瑰图
作用:表示不同类别数值相对于总数的占比情况(类别<=5)
2、堆积图、百分比堆积图 ⭐️
作用:显示多个部分到整体的关系