其实,本文就是想分享一个做可视化的捷径!
制作可视化的方式有千千万。
Excel 控若能轻车熟路驾驭 VBA,能玩出各种花来,再不济借助图表插件外援也能秒杀一众小白选 手。
会编程的,Echarts 几十行代码,分分钟出秀;R 语言玩得一手数据挖掘,可视化自不在话下;Python 爬数据达人,手握 matplotlib 包打天下。
这么多工具,从哪个入手较好?这也是很多人犯难的。
其实,数据分析大家大可不必垂涎于工具。对于绝大多数的我们,需求在于从万千数据中统计出一 些规律,或者某些业务问题想通过分析数据的方法得到求证。
分析工具更多的价值在于辅助分析过程中数据的处理,能够将结论以可视化的方式直观展,最终解 决问题。如果在功能上能做到避免写公式写代码,易上手易用,那就更好了
笔者一直主张用 BI 分析,于数据分析师,节省时间提高效率。于入门,BI 也是最简单最好上手的可 视化分析工具。
之前分享了 《数据分析工具 link,》讲解了 FineBI 的主要功能、特点和基本 使用方法。
依照承诺,要分享一个实操类的文章。
所以今天想着重于数据分析的过程,来手把手教大家制作一个可视化报表。
PS:其实可视化报告真的不难,只要有一些分析基础,外加掌握 1~2 个工具即可。
一、数据分析的操作思路
数据分析通常是这样切入的,比方说业务上发生了变化,流量下降 20%,那么我们就要分析可能的 原因,需要多方数据去验证假设。又或者拿到一份数据,思考可以分析的规律点。无论哪种情况, 一个完整的数据分析都需要经历数据获取、数据预处理、数据分析与建模、可视化分析及报告撰写 的过程。
FineBI 这个 BI 工具的功能模块也是依据分析的流程来设计的,分为数据连接、数据准备、可视化分 析、仪表板驾驶舱、分享仪表板等。
二、认识这个工具——FineBI 的工作区
官网安装好合适的版本,成功激活,设置初始账号密码后,会跳转到这个 web 页面。
左侧是导航栏,类似于菜单栏。目录类似首页,展现已完成的分析报告,这里默认展现官方的内置 demo。
数据准备是连接数据、准备数据,以及对数据进行再加工处理的地方,可进行业务包、数据表、关 联、多路径、数据更新、自助数据集等管理。
仪表板即创建可视化分析。管理系统即对整个数据决策系统进行管理的地方,包括目录的设置、外 观设置、数据、报表、分享权限等管理配置。
创建是提供给用户快捷新建数据连接、添加数据库表、 添加 SQL 数据集、添加 EXCEL 数据集、添 加自助数据集、新建仪表板的地方。
三、连接/导入数据
制作数据报告,第一步是导入数据,FineBI 能从很多种数据源导入数据:如 Excel,CSV,XML, 以及各类数据库(SQL Server,Oracle,My SQL 等),两大主流开源平台(Hadoop,Spark)等等。 最常用的方式是连接数据库和导入 excel 数据。两种方式因为最常用,所以这里都演示操作一遍。
1、数据库连接举例:连接 mysql
2、导入 excel 数据
同样的数据,用一份 excel 导入。
第一步:数据准备—添加业务包,业务包是用来统一整理数据表的。这里创建一个台风数据包。点 击添加表,新建 excel 数据集。
就得到如下的数据明细。这里可以自动识别数据的字段类型,也可以修改字段类型。(举例:有些 情况下将时间识别成文本类型,需要手动切换成时间类型,不然会影响后续操作)
至此,数据就导入成功。
四、数据塑性—自助数据集
自助数据集其实是数据加工的环节。一般我们拿到的数据往往是有空缺值有重复,所谓脏数据,脏 数据需要清理,关于数据清洗的处理可以写 5000 字篇,这里就不多讲了。更常见的情况是分析中
需要新建一些字段,这是源数据所没有的。这时候就可以根据需求对原数据进行再加工处理,新建
一个用于分析的数据集。再处理的操作包括:选择字段、过滤、分组汇总、新增列、字段设置、排 序、左右合并、上下合并、挖掘。
这里因为分析的比较简单,且原始数据已经很规范,所以暂时还不需要对源数据表进行这些操作, 且一些过滤操作可以放到后面创建分析图表的过程中去做。
其实,在自助数据集之前,有个功能没讲到。FineBI 有个管理员的说法,这在企业部署中会涉及。 管理员可以给不用人分配不同权限下的数据,比如财务的只能看财务和销售的数据,或者一部分财 务人员只能看到特定的业务包里的数据,或者部分数据表,这些都是出于数据安全以及流程管理考 虑。在管理员准备好数据后,就可以分配给不同人员账号,以及部分权限的数据。如果是个人使用, 比如本文所要介绍的分析,BI 系统是部署在自己本地的,那自己就是管理员,拥有最高权限。本文 的分析暂时不需要用到权限功能,这里只做简单介绍。
五、可视化分析
到这里数据准备好了,接下来开始正式分析。
先来观察这份数据,这份数据是我从网上当下来的,展示了 1945 年——2015 年登陆我国的台风信 息,包括时间、登陆省市以及台风强度。
那么我们可以汇总统计下历年来台风最常光顾的省份和城市有哪些,一年中哪个时间段是台风频发 日,以及台风强度分布。
1、 新建仪表板,即我们说的可视化报告、dashboard,叫法很多。
2、 新建可视化组件,添加刚刚导入的数据集。(图表、查询筛选框等都叫组件,是 finebi 仪表板
的组成元素。)
分析 1:各年度登陆我国的台风数量
添加完数据集会进入到这个分析界面。拖拽要分析的字段(记录数—统计台风数量的指标,登陆时 间——这里只展示年份这个维度)
这里要注意,
源数据表中一个台风有多行记录,那是因为台风可能同时登陆两个区域,记录了两条信息,所以记 录数要依赖 CMA 编号统计(记录数右侧小三角下拉),以免重复。
其次,这里又添加了一个统计每年台风平均数的指标。
最后再对次图表稍加美化,通常在图形属性和组件样式中:
① 修改线条颜色:图形属性—颜色
② 修改连线为平滑曲线,并且可调整有无标记点
③ 修改该组件标题:组件样式—标题,可调整字体样式
最终得到如下成图:
能明显感觉到登陆我国的台风呈现一个 2~4 年的波动变化,且 2000 年以来,直击我国的台风整体 数量有略微下降。
分析 2:台风登陆各省沿海城市分布—数据地图
这里演示一下数据地图的制作,用地图直观展现台风登陆我国沿海各省市的分布。
必须将维度创建成地图角色,生成经纬度。
匹配好数据后生成省份(经度)、省份(纬度)字段。这里要注意检查一些匹配是否正确,我就遇 到把辽宁省匹配成宁夏的 bug,匹配有问题可以随时调整。
然后将字段分别拖至横轴和纵轴,会自动生成一个填充地图。除此之外还有点地图、热力地图等, 这里就用填充地图举例。
填充地图顾名思义,就是用区域的颜色区分数值大小。这里将记录数拖拽到图形属性-颜色,即可看 到区分,(颜色可在下拉框中自行选取)。再将记录数拖拽到标签,即可显示登陆该省市的台风数 量。
在组件样式——背景中,可以修改 GIS 地图样式,如下:
注:关于图表组件的样式,比如标题名(字体大小颜色)、轴线、配色,图表布局等都可在图形属 性和组件样式中选择。选项非常多,请读者们自行发挥自己的美学天赋吧!关于数值的计算、过滤 排序等操作,都可在横轴、纵轴的指标维度下拉框中找到。
六、可视化报告
其他分析大同小异,篇幅有限,以上只举了两个例子。
图表分析组件完成之后,就是构建可视化报告(dashboard)了。
仪表盘样式中有预设的模板可以直接套用,以下是笔者随便套用的一个模板,更具模板的风格,后 面调整了每个图表的样式和配色。好不好看全看个人审美了。
小结
总的来说,使用 FineBI 制作可视化报表,最关键的还是在于数据处理,数据处理好了,报表绘制起 来才能得心应手。由于数据之前在 excel 里已经做了一些处理,所以拿到的数据基本可以直接上手 分析。
在充分掌握了数据处理技巧后,就可以将更多精力放在各种各样的可视化图形上。FineBI 内置了很 多配色及风格,接下来大家可以尽情发挥自己的想象力制作各种酷炫的可视化报表,尽量搞清楚可 视化制作中所有内置图形的绘制方法,以及样式调整。