震惊!邻桌的程序猿做可视化报告竟然比我还快,带着好奇心我打开了他的电脑,发现惊天秘密,原因竟是...

news2024/11/26 16:55:06

其实,本文就是想分享一个做可视化的捷径!

制作可视化的方式有千千万。

Excel 控若能轻车熟路驾驭 VBA,能玩出各种花来,再不济借助图表插件外援也能秒杀一众小白选 手。
会编程的,Echarts 几十行代码,分分钟出秀;R 语言玩得一手数据挖掘,可视化自不在话下;Python 爬数据达人,手握 matplotlib 包打天下。
这么多工具,从哪个入手较好?这也是很多人犯难的。

其实,数据分析大家大可不必垂涎于工具。对于绝大多数的我们,需求在于从万千数据中统计出一 些规律,或者某些业务问题想通过分析数据的方法得到求证。
分析工具更多的价值在于辅助分析过程中数据的处理,能够将结论以可视化的方式直观展,最终解 决问题。如果在功能上能做到避免写公式写代码,易上手易用,那就更好了
笔者一直主张用 BI 分析,于数据分析师,节省时间提高效率。于入门,BI 也是最简单最好上手的可 视化分析工具。
之前分享了 《数据分析工具 link,》讲解了 FineBI 的主要功能、特点和基本 使用方法。
依照承诺,要分享一个实操类的文章。

所以今天想着重于数据分析的过程,来手把手教大家制作一个可视化报表。

PS:其实可视化报告真的不难,只要有一些分析基础,外加掌握 1~2 个工具即可。

在这里插入图片描述

一、数据分析的操作思路

数据分析通常是这样切入的,比方说业务上发生了变化,流量下降 20%,那么我们就要分析可能的 原因,需要多方数据去验证假设。又或者拿到一份数据,思考可以分析的规律点。无论哪种情况, 一个完整的数据分析都需要经历数据获取、数据预处理、数据分析与建模、可视化分析及报告撰写 的过程。
FineBI 这个 BI 工具的功能模块也是依据分析的流程来设计的,分为数据连接、数据准备、可视化分 析、仪表板驾驶舱、分享仪表板等。

二、认识这个工具——FineBI 的工作区

在这里插入图片描述

官网安装好合适的版本,成功激活,设置初始账号密码后,会跳转到这个 web 页面。

左侧是导航栏,类似于菜单栏。目录类似首页,展现已完成的分析报告,这里默认展现官方的内置 demo。
数据准备是连接数据、准备数据,以及对数据进行再加工处理的地方,可进行业务包、数据表、关 联、多路径、数据更新、自助数据集等管理。
仪表板即创建可视化分析。管理系统即对整个数据决策系统进行管理的地方,包括目录的设置、外 观设置、数据、报表、分享权限等管理配置。
创建是提供给用户快捷新建数据连接、添加数据库表、 添加 SQL 数据集、添加 EXCEL 数据集、添 加自助数据集、新建仪表板的地方。
三、连接/导入数据

制作数据报告,第一步是导入数据,FineBI 能从很多种数据源导入数据:如 Excel,CSV,XML, 以及各类数据库(SQL Server,Oracle,My SQL 等),两大主流开源平台(Hadoop,Spark)等等。 最常用的方式是连接数据库和导入 excel 数据。两种方式因为最常用,所以这里都演示操作一遍。
1、数据库连接举例:连接 mysql

在这里插入图片描述

2、导入 excel 数据

同样的数据,用一份 excel 导入。

第一步:数据准备—添加业务包,业务包是用来统一整理数据表的。这里创建一个台风数据包。点 击添加表,新建 excel 数据集。

就得到如下的数据明细。这里可以自动识别数据的字段类型,也可以修改字段类型。(举例:有些 情况下将时间识别成文本类型,需要手动切换成时间类型,不然会影响后续操作)

在这里插入图片描述

至此,数据就导入成功。

四、数据塑性—自助数据集

自助数据集其实是数据加工的环节。一般我们拿到的数据往往是有空缺值有重复,所谓脏数据,脏 数据需要清理,关于数据清洗的处理可以写 5000 字篇,这里就不多讲了。更常见的情况是分析中

需要新建一些字段,这是源数据所没有的。这时候就可以根据需求对原数据进行再加工处理,新建
一个用于分析的数据集。再处理的操作包括:选择字段、过滤、分组汇总、新增列、字段设置、排 序、左右合并、上下合并、挖掘。

在这里插入图片描述

这里因为分析的比较简单,且原始数据已经很规范,所以暂时还不需要对源数据表进行这些操作, 且一些过滤操作可以放到后面创建分析图表的过程中去做。
其实,在自助数据集之前,有个功能没讲到。FineBI 有个管理员的说法,这在企业部署中会涉及。 管理员可以给不用人分配不同权限下的数据,比如财务的只能看财务和销售的数据,或者一部分财 务人员只能看到特定的业务包里的数据,或者部分数据表,这些都是出于数据安全以及流程管理考 虑。在管理员准备好数据后,就可以分配给不同人员账号,以及部分权限的数据。如果是个人使用, 比如本文所要介绍的分析,BI 系统是部署在自己本地的,那自己就是管理员,拥有最高权限。本文 的分析暂时不需要用到权限功能,这里只做简单介绍。

**在这里插入图片描述
五、可视化分析

到这里数据准备好了,接下来开始正式分析。

先来观察这份数据,这份数据是我从网上当下来的,展示了 1945 年——2015 年登陆我国的台风信 息,包括时间、登陆省市以及台风强度。
那么我们可以汇总统计下历年来台风最常光顾的省份和城市有哪些,一年中哪个时间段是台风频发 日,以及台风强度分布。
1、 新建仪表板,即我们说的可视化报告、dashboard,叫法很多。

2、 新建可视化组件,添加刚刚导入的数据集。(图表、查询筛选框等都叫组件,是 finebi 仪表板
的组成元素。)

分析 1:各年度登陆我国的台风数量

添加完数据集会进入到这个分析界面。拖拽要分析的字段(记录数—统计台风数量的指标,登陆时 间——这里只展示年份这个维度)

在这里插入图片描述

这里要注意,

源数据表中一个台风有多行记录,那是因为台风可能同时登陆两个区域,记录了两条信息,所以记 录数要依赖 CMA 编号统计(记录数右侧小三角下拉),以免重复。
其次,这里又添加了一个统计每年台风平均数的指标。

最后再对次图表稍加美化,通常在图形属性和组件样式中:

① 修改线条颜色:图形属性—颜色

② 修改连线为平滑曲线,并且可调整有无标记点

③ 修改该组件标题:组件样式—标题,可调整字体样式
最终得到如下成图:

在这里插入图片描述

能明显感觉到登陆我国的台风呈现一个 2~4 年的波动变化,且 2000 年以来,直击我国的台风整体 数量有略微下降。
分析 2:台风登陆各省沿海城市分布—数据地图

这里演示一下数据地图的制作,用地图直观展现台风登陆我国沿海各省市的分布。

必须将维度创建成地图角色,生成经纬度。
在这里插入图片描述

匹配好数据后生成省份(经度)、省份(纬度)字段。这里要注意检查一些匹配是否正确,我就遇 到把辽宁省匹配成宁夏的 bug,匹配有问题可以随时调整。
然后将字段分别拖至横轴和纵轴,会自动生成一个填充地图。除此之外还有点地图、热力地图等, 这里就用填充地图举例。
填充地图顾名思义,就是用区域的颜色区分数值大小。这里将记录数拖拽到图形属性-颜色,即可看 到区分,(颜色可在下拉框中自行选取)。再将记录数拖拽到标签,即可显示登陆该省市的台风数 量。

在组件样式——背景中,可以修改 GIS 地图样式,如下:
在这里插入图片描述

注:关于图表组件的样式,比如标题名(字体大小颜色)、轴线、配色,图表布局等都可在图形属 性和组件样式中选择。选项非常多,请读者们自行发挥自己的美学天赋吧!关于数值的计算、过滤 排序等操作,都可在横轴、纵轴的指标维度下拉框中找到。
六、可视化报告

其他分析大同小异,篇幅有限,以上只举了两个例子。

图表分析组件完成之后,就是构建可视化报告(dashboard)了。

仪表盘样式中有预设的模板可以直接套用,以下是笔者随便套用的一个模板,更具模板的风格,后 面调整了每个图表的样式和配色。好不好看全看个人审美了。

在这里插入图片描述

在这里插入图片描述

小结

总的来说,使用 FineBI 制作可视化报表,最关键的还是在于数据处理,数据处理好了,报表绘制起 来才能得心应手。由于数据之前在 excel 里已经做了一些处理,所以拿到的数据基本可以直接上手 分析。
在充分掌握了数据处理技巧后,就可以将更多精力放在各种各样的可视化图形上。FineBI 内置了很 多配色及风格,接下来大家可以尽情发挥自己的想象力制作各种酷炫的可视化报表,尽量搞清楚可 视化制作中所有内置图形的绘制方法,以及样式调整。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/333026.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Flink反压如何排查

Flink反压利用了网络传输和动态限流。Flink的任务的组成由流和算子组成,那么流中的数据在算子之间转换的时候,会放入分布式的阻塞队列中。当消费者的阻塞队列满的时候,则会降低生产者的处理速度。 如上图所示,当Task C 的数据处…

nuxt 学习笔记

这里写目录标题路由跳转NuxtLinkquery参数params参数嵌套路由tab切换效果layouts 文件夹强制约定放置所有布局文件&#xff0c;并以插槽的形式作用在页面中1.在app.vue里面2.component 组件使用Vue < component :is"">Vuex生命周期数据请求useFetchuseAsyncDat…

鸿蒙设备学习|快速上手BearPi-HM Micro开发板

系列文章目录 第一章 鸿蒙设备学习|初识BearPi-HM Micro开发板 第二章 鸿蒙设备学习|快速上手BearPi-HM Micro开发板 文章目录系列文章目录前言一、环境要求1.硬件要求2.软件要求3.Linux构建工具要求4.Windows开发工具要求5.工具下载地址二、安装编译基础环境1.安装Linux编译环…

【速通版】吴恩达机器学习笔记Part1

准备速通一下吴恩达的机器学习 很快做个笔记5.2.3 监督学习 part 2_哔哩哔哩_bilibili 1.概述&#xff08;P1-P3) ML是AI的重要部分&#xff0c;AI的目标是AGI&#xff08;artificial general intelligence&#xff09;但是目前就。。。。 supervised learning&#xff1a;目…

如何开发L2毫秒接口?

L2毫秒接口普遍应用于大众的日常生活中&#xff0c;并且很多的企业通过api进行数据内容的调用&#xff0c;从而在技术上和成本上得到福利。 进行数据的整合与共享是L2毫秒接口的主要用途之一&#xff0c;所以开发L2毫秒接口就必须慎重&#xff0c;注意安全隐患&#xff0c;防止…

VHDL语言基础-组合逻辑电路-其它组合逻辑模块

目录 多路选择器&#xff1a; 逻辑功能&#xff1a; 常用的类型&#xff1a; 4选1多路选择器的实现&#xff1a; 求补器&#xff1a; 求补器的实现&#xff1a; 三态门&#xff1a; 三态门的应用实例&#xff1a; 三态门的实现&#xff1a; 缓冲器&#xff1a; 什么是…

Lesson 6.4 逻辑回归手动调参实验

文章目录一、数据准备与评估器构造1. 数据准备2. 构建机器学习流二、评估器训练与过拟合实验三、评估器的手动调参在补充了一系列关于正则化的基础理论以及 sklearn 中逻辑回归评估器的参数解释之后&#xff0c;接下来&#xff0c;我们尝试借助 sklearn 中的逻辑回归评估器&…

Ts笔记第一天

文章目录安装 ts运行环境 nodeTS类型数字 、字符串 和布尔类型字面量any 和unknown类型断言void和neverobjectArraytuple 元组enum 枚举安装 ts运行环境 node node-v看版本号 2. 安装ts -g全局安装 npm i -g typescript // 这里全局安装 -s安装无法使用tsc 创建一个01.ts文…

第五十章 动态规划——数位DP模型

第五十章 动态规划——数位DP模型一、什么是数位DP数位DP的识别数位DP的思路二、例题1、AcWing 1083. Windy数&#xff08;数位DP&#xff09;2、AcWing 1082. 数字游戏&#xff08;数位DP&#xff09;3、AcWing 1081. 度的数量&#xff08;数位DP&#xff09;一、什么是数位DP…

供应PEG试剂AC-PEG-COOH,Acrylate-PEG-Acid,丙烯酸酯-PEG-羧基

英文名称&#xff1a;AC-PEG-COOH&#xff0c;Acrylate-PEG-Acid 中文名称&#xff1a;丙烯酸酯-聚乙二醇-羧基 丙烯酸酯-PEG-COOH是一种含有丙烯酸酯和羧酸的线性杂双功能PEG试剂。它是一种有用的带有PEG间隔基的交联剂。丙烯酸酯可与紫外光或自由基引发剂聚合。丙烯酸酯-PE…

从FPGA说起的深度学习(二)

这是新的系列教程&#xff0c;在本教程中&#xff0c;我们将介绍使用 FPGA 实现深度学习的技术&#xff0c;深度学习是近年来人工智能领域的热门话题。在本教程中&#xff0c;旨在加深对深度学习和 FPGA 的理解。用 C/C 编写深度学习推理代码高级综合 (HLS) 将 C/C 代码转换为硬…

Leetcode.1797 设计一个验证系统

题目链接 Leetcode.1797 设计一个验证系统 Rating : 1534 题目描述 你需要设计一个包含验证码的验证系统。每一次验证中&#xff0c;用户会收到一个新的验证码&#xff0c;这个验证码在 currentTime时刻之后 timeToLive秒过期。如果验证码被更新了&#xff0c;那么它会在 curr…

完成各种项目生态环评工作丨全流程基于最新导则下的生态环境影响评价技术方法及图件制作与案例

目录 专题一 生态环境影响评价框架及流程 专题二 基于遥感解译的土地利用现状图的编制 专题三 生物多样性测定及R语言分析 专题四 植被类型及植被覆盖度图的编制 专题五 生物量与净初级生产力测定&#xff1a;实测及模型 专题六 生态系统类型及服务价值评估 专题七 物种…

【漫漫转码路】Day 45 机器学习 day04

梯度下降 梯度下降法是常用于求解无约束情况下凸函数的极小值&#xff0c;是一种迭代类型的算法&#xff0c;因为凸函数只有一个极值点&#xff0c;故求解出来的极小值点就是函数的最小值点 公式 第一个θ&#xff0c;是更新之后的θ&#xff0c;第二个θ是更新之前的θ&…

数据挖掘,计算机网络、操作系统刷题笔记47

数据挖掘&#xff0c;计算机网络、操作系统刷题笔记47 2022找工作是学历、能力和运气的超强结合体&#xff0c;遇到寒冬&#xff0c;大厂不招人&#xff0c;可能很多算法学生都得去找开发&#xff0c;测开 测开的话&#xff0c;你就得学数据库&#xff0c;sql&#xff0c;orac…

【LeetCode】1797. 设计一个验证系统

1797. 设计一个验证系统 题目描述 你需要设计一个包含验证码的验证系统。每一次验证中&#xff0c;用户会收到一个新的验证码&#xff0c;这个验证码在 currentTime 时刻之后 timeToLive 秒过期。如果验证码被更新了&#xff0c;那么它会在 currentTime &#xff08;可能与之…

理解HDFS工作流程与机制,看这篇文章就够了

HDFS(The Hadoop Distributed File System) 是最初由Yahoo提出的分布式文件系统&#xff0c;它主要用来&#xff1a; 1&#xff09;存储大数据 2&#xff09;为应用提供大数据高速读取的能力 重点是掌握HDFS的文件读写流程&#xff0c;体会这种机制对整个分布式系统性能提升…

训练营day16

104.二叉树的最大深度 559.n叉树的最大深度111.二叉树的最小深度222.完全二叉树的节点个数104.二叉树的最大深度 力扣题目链接 给定一个二叉树&#xff0c;找出其最大深度。 二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。 说明: 叶子节点是指没有子节点的节点。 示…

javaEE 初阶 — UDP 协议

文章目录UDP 协议1. UDP协议报文结构1.1 一个 UDP 数据报能传输的最大数据1.2 校验和1.3 生成校验和的算法UDP 协议 1. UDP协议报文结构 16位UDP长度&#xff0c;表示整个数据报&#xff08;UDP首部UDP数据&#xff09;的最大长度&#xff0c;如果校验和出错&#xff0c;就会直…

计算机网络之http02| HTTPS HTTP1.1的优化

post与get请求的区别 get 是获取资源&#xff0c;Post是向指定URI提交资源&#xff0c;相关信息放在body里 2.http有哪些优点 &#xff08;1&#xff09;简单 报文只有报文首部和报文主体&#xff0c;易于理解 &#xff08;2&#xff09;灵活易拓展 URI相应码、首部字段都没有…