Highlights
-
一张漂亮的配图能让论文增色不少,但现在的图表类型越来越丰富,学者们很难选择合适的绘图类型进行可视化。
-
随着大数据和云计算的发展,我们很容易就能获取大量的数据,但是将这些数据美观地展示出来不是一件容易的事情。
-
本文帮助大家选取可视化的类型,并提供丰富的源码。
可视化的要点
科研数据可视化的技巧和要点有很多,其中包括:选择合适的图表类型、设计易于理解的图表、使用颜色和字体来强调重点、避免使用过于复杂的图表。
今天来讲讲如何选择合适的图表和设计易于理解的图表
常用的可视化工具,如Matplotlib、Seaborn、ggplot、Basemap、Matlab、Origin、cartopy、和ProPlot等
建议掌握一种工具绘图(Origin、Excel等)、一种图层语言(ggplot,seaborn)、一种地理绘图(cartopy、proPlot)即可
根据目的选择图表
拿到数据,首先选择合适的图表。首先是按用途选择:
一个非常经典的 Chart Suggestions---A Thought-Starter by Andrew Abela
(所有的PDF资源整合到了文末领取)
这个 Chart Suggestions 从四个维度提供了可供选择的类型,而主要是根据你想展示的内容进行的
更细致的图表如图(文末领取):
这张表(文末领取)按照更多的维度进行了更细致地分类,根据你的展示目的选择合适的可视化方式
从可视化宇宙中查看排名
Adioma 和 Google News Lab提供了一个可视化宇宙,清楚地展示了人们选择图表的倾向、工具和参考书:
http://visualizationuniverse.com/
可以根据受欢迎程度来选择你的图表:
包括很多可视化的学习资料:
根据数据选择图表
有时候可视化不取决于我们的目的,而取决于我们有什么样的数据,这时候数据类型就很重要。
可以参考下面这张表:
有时根据目的选择最合适和最方便的图表很复杂。上图可以从数据驱动的角度帮助您找出应该使用哪种类型的图表。您所需要的只是获得有关您的数据的信息。
之后,通过回答给定的问题。这些问题将作为一个框架,提供有关合适图表的建议,帮助制作和选择一个引人入胜的图表。
我们信息图的分支是分层构建的,从顶部开始。首先,回答你是否有一个或多个变量。如果你只有一个变量向左移动。然后,决定这个变量是否有序。因此,如果只有一个变量,可以从以下类型中选择图表:
折线图、面积图、箱型图、直方图、密度图
现在,让我们看看右侧。起点保持不变——定义变量的特征。如果特征不相似,那么我们向左移动并定义变量是否为有序数据。如果不是,我们应该使用散点图;如果是——从面积图或连接的散点图中选择。
另一个参考工具是DataVizProject
https://datavizproject.com/#
优点是每种图含有数据格式,可以根据您的数据选择合适的图表:
如下图的Stacked Bar Chart至少需要一个2维的数据
此外还可以在Examples中找到相关的例子和可能的源代码。
还可以根据输入数据的类型找到适合的图表:
寻找可视化的代码
使用交互式的From Data to Viz
https://www.data-to-viz.com/
-
点击Explore选择合适的分类和图表:
2.点击心仪的图表,再点击你熟悉的编程语言获得代码:
3.选择一个你认为美观的图表,点进去
4.复制代码,然后替换数据为你自己的数据:
总结
将所有上述提到的资源(和更多我总结的绘图资源整合如下)
-
Chart Suggestions---A Thought-Starter by Andrew Abela --- 经典之作(最新版)
-
Jon Schwabish 和 Severino Ribecca 的Graphic Continuum --- 五个类别的主要来源
-
Financial Times Visual Journalism 的Visual Vocabulary
--- 带有大量进一步链接的图表选择助手
-
互动版
-
静态版本
-
-
From Data to Viz
by Yan Holtz --- 交互式,包含每种图表类型的信息和代码
-
R代码合集
-
Python代码合集
-
D3js代码合集
-
-
ferdio 的DataVizProject --- 与大量示例交互
-
Adioma 和 Google News Lab 的可视化宇宙
-
如何选择正确的图表类型 --- 一个非常细致地图表决策树
-
国家地理:将数据可视化从视觉效果提升到效率
-
William S. Cleveland 和 Robert McGill:图形感知:图形方法开发的理论、实验和应用
-
Hadley Wickham:图形的分层语法 (Hadley大神力作)
-
Tracey L. Weissgerber 等人:Beyond Bar and Line Graphs: Time for a New Data Presentation Paradigm
-
Numeroteca:大众媒体中数据可视化的使用和滥用 (一些可视化理论)
-
Andy Cotgreave:数据可视化批评的必然性
-
Alberto Cairo:“我们的读者”不会理解这么复杂的事情!
-
Alberto Cairo:可视化的扩展词汇