数据可视化的图表类型十分丰富,好的图表可以有效、清晰地呈现数据的信息。对于用户而言,选择正确的图表是十分关键的,不仅可以达到“一图胜千言”的效果,而且会直接影响分析的结果。
用户选择正确的数据可视化图表前,需要明确数据的逻辑关系。数据的逻辑关系可分为4种:比较、分布、构成和联系。其中,比较关系主要关注数据中各类别或时间变化的情况:分布关系主要关注不同数值范围内包含数据量的情况;构成关系主要关注各部分与整体占比的情况:联系关系主要关注两个及两个以上的变量之间关系的情况。
数据可视化专家基于以上4种关系对图表的选择思路进行了总结,引导用户逐步明确需求,从而帮助用户快速且正确地选择图表。下面分别介绍基于比较、分布、构成和联系关系的数据可选择的图表,具体内容如下。
1.基于比较关系可选择的图表
基于比较关系的数据可选择的图表如图1所示。
图1基于比较关系可选择的图表
由图1可知,若数据按照时间进行比较,当数据周期少时可以选择柱形图或折线图,当数据周期多时可以选择雷达图或折线图;若数据按分类进行比较,当每个项目中仅包含1个变量时可以选择表格、条形图或柱形图,当每个项目包含2个变量时可以选择不等宽柱形图。
2.基于分布关系可选择的图表
基于分布关系的数据可选择的图表如图2所示。由图2可知,基于分布关系的数据包括单变量(例如文化程度)、2个变量(例如文化程度与收入期望)、3个变量(例如文化程度、收入期望与工作经验)。若数据为单变量,可以选择直方图或正态分布图:若数据为2个变量,可以选择散点图:若数据为3个变量,可以选择曲面图。
图2 基于分布关系的可选择的图表
3.基于构成关系可选择的图表
基于构成关系的数据可选择的图表如图3所示。
图3基于构成关系可选择的图表
由图3可知,基于构成关系的数据按照是否变化可分为静态数据和随时间变化的数据。若是静态数据,可以选择饼图、瀑布图或堆积柱形图:若为镇时间变化的数据,则先按照周期数分为少数周期数据和多周期数据,对于少数周期数据可以选择堆积柱形图,对于多周期数据可以选择堆积面积图。
4.基于联系关系可选择的图表
基于联系关系的数据可选择的图表如图4所元。由图4可知,若数据中包含2个变量可以选择散点图进行展示;若数据中包含3个变量,可以选择气泡图进行展示。