做分析用什么工具

news2024/11/25 22:27:19

做分析用什么工具

导读

数据分析是数据辅助决策的最后一公里,是最终的数据可视化展示与探索分析的部分,选择使用最适合的数据展示方式,可以帮助分析人员大大提升分析效率。

问题:

● 纠结选择哪个工具
● 纠结从哪里学起,甚至害怕会不会学完就过时没用了

有哪些BI工具

数据分析工具类软件,大体可以分为以下6类: Excel生态工具、数理统计工具、BI工具、数据库工具、编程工具 (Excel单独分成一类,主要是因为它应用场景广泛,且用户基数过于庞大,甚至超过其他所有工具用户之和) 每个类别的代表工具分别有:

● Excel生态:Excel、VBA、PowerQuery、PowerPivot、Power View、Power Map

● 数理统计工具:SAS、SPSS、Stata、Minitab、Eviews、Statistica、MATLAB、Mathematica

● 分析编程工具:Python、R、Julia、Scala、Spark、Java、Hadoop

● BI工具:分为开源BI工具和商业BI工具两大类 ● 商业BI工具有:FineBI、QlikView、Tableau、Power BI、SmartBI、QuickBI等

● 开源BI工具有:Superset、Redash、Metabase、CBoard、Davinci、SpagoBI、Pentaho等

● 数据库工具:MySQL、PostgreSQL、Oracle、SQLServer、MongoDB、Hive

了解数据分析过程

数据分析的过程:数据采集-数据加工-数据处理-数据分析-数据可视化- 报告撰写-分析汇报-数据共享。

了解数据源

增加对数据源的认识,从格式上来看可以分为文本格式、数据库、集群几个概念,从结构上可以划分为结构式数据库和非结构式式数据库

选择数据分析工具

当确认分析目标之后,我们应该根据数据的体量来选择分析工具和报表工具

以往的经验会告诉我们,数据分析效率低大概有这么几个因素:
1、处理小数据的时候,对于非结构化的数据,统计起来很难,需要学习编程类的工具;

2、已有的知识,处理不来大规模数据集,这时候需要学习新的语言,以及熟悉大数据数仓模型中指标、维度、模型的概念;

3、用SQL处理大规模数据的时候,跑数跑的特别慢,需要了解数据库相关的知识,优化慢SQL

● 没有做数据模型,多个表做数据关联,跑起来很慢——dw层建设,抽象成指标做维度建模,T+1任务调度

● 很多个大表关联一起,数据跑不出来——需要做分区设计,根据业务域做ads小表,做指标应用

● 数据跑出来有重复——尽可能少的做

认识BI和BI工具

BI的概念

BI(BusinessIntelligence)即商业智能,越来越多的智能软件供应商推出可视化数据分析工具,应对企业业务人员的大数据分析需求。 清楚几个概念:

商业大数据BI产品

通用的解决方案包括: 1、自助分析平台:包含数据集成、数据洞察分析、数据门户、权限集成的完整解决方案; 2、客户画像:以客户为中心,构建客户全息画像,360°了解客户,帮助企业更精准的解决问题; 3、大数据营销:提供客户数据标签管理、智能圈人、人群扩散、位置营销、营销效果分析; 4、 大数据风控:基于大数据构建风险识别模型,提供交易反欺诈、信用反欺诈服务。

写在最后,给到新来者的建议

工具选择,因人而异,选择适合自己的最重要,不要过分沉迷于工具

1. 选好书籍打基础,资料宜精不宜广

看书籍是为了先打好基础,然后构建个人知识框架。市面上的资源太多了,选择一本经典教材或者课程非常重要,建议买纸质书,花了钱有沉默成本存在,这个书才香,才容易读完。最后利用“碎片化”时间、从解决实际问题出发去提升自己

2. 切忌大而全,工具宜少不宜多

工具是最容易掌握的,真正提高工作效率的,都是大家常提的、公认的,脱离实际场景的内容,正所谓“屠龙之术,学而无用”,很多人都喜欢鼓捣各种软件、工具,后来发现有些工具用过一次就再也没碰过。 比如:你做数据量少了200M的 简单分析,Excel和SPSS一般是最佳选择 出活儿快! 而SQL是用来提数跑数的,你必须得会,得熟练,不然时间都耗在这儿了 当你遇到数据量较大或者需要复杂模型,就可以上PYTHON和R了 当然如果是你公司有大数据平台,就可能使用HIVE、SPARK、STOM等等

提示一点:切记不要为了追求高大上的模型或者效果

3. 边干边学 边整理 记住“以用促学,以教促学”

一定要带着问题、带着坑,去学习,你的记忆才会深刻 很多人常常翻着一本厚厚的EXCEL秘籍自学,总是感觉学不会、学了就忘呢?使用Excel函数的时候,却又要到处搜索资料,用完即扔。 原因主要有2点:

一是短练,因为没有实战的机会,用的太少了!

二是太懒,用完了就结束了,从来不总结整理!

4、定期整理沉淀自己,消化知识

一种方法是,画思维导图梳理体系,知识才能内化成你自己的东西;

第二是,多多和别人交流和分享,思维的碰撞,能加深个人的理解和感悟 数据分析,是各行各业都需要的技能,不同行业的数据分析,分析方向和内容也是千差万别。不是所有做分析的人,都能获得高财富回报,需要和经营、运营、财务、市场、营销做结合,才能实现价值提升。

多注重业务理解,多实践积累经验,才是王道。

否则,如果提供不到决策支撑、发挥不了数据影响,分析也就没有什么意义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1493212.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java 学习和实践笔记(27):Object类的基本特性、toString方法以及IDEA的部分快捷键介绍

Object类基本特性: 1.Object类是所有类的父类,所有的Java对象都拥有Object类的属性和方法(注意拥有并不等于可以直接使用) 2.如果在类的声明中未使用extends,则默认继承Object类。 toString方法是Object类里定义的一个…

连接器中的PI “电源完整性”

【摘要/前言】 在连接器中,我们经常谈论信号完整性(SI)以及我们为最新应用开发新的高速连接器解决方案的工作。很多厂商在112Gbps PAM4信令领域非常活跃,但我们也经常谈论224Gbps PAM4。在之前对Samtec产品管理总监Keith Guetig的…

26.基于springboot + vue实现的前后端分离-就业管理系统

项目介绍 系统分为管理员、企业、求职者三个角色 管理员: 登录、个人中心、学生信息管理、企业信息管理、岗位分类管理、学历信息管理、友情链接管理、新闻资讯管理、收藏管理、招聘信息管理、应聘信息管理、求职者信息管理 企业: 注册、登录、个人…

【Leetcode 2673】使二叉树所有路径值相等的最小代价 —— 贪心法

2673. 使二叉树所有路径值相等的最小代价 给你一个整数n表示一棵 满二叉树 里面节点的数目,节点编号从1到n。根节点编号为1,树中每个非叶子节点i都有两个孩子,分别是左孩子2 * i和右孩子2 * i 1。 树中每个节点都有一个值,用下…

虚拟化之内存(Memory)

一 内存的查看方式 free -k/m/h cat /proc/meminfodmesg |grep memory free命令的实质是根据meminfo中的文件来提取信息 二 内存虚拟化 1.概念:由于物理MMU只能通过Host机的物理地址进行寻址,所以实现内存虚拟化,关键是需要将Guest机的…

Unity性能优化篇(二) 静态合批步骤与所有注意事项\游戏运行时使用代码启动静态合批

静态合批步骤: 1.开启Project Settings —>Player–>Other Setting里勾选Static Batching选项(一般情况下unity都是默认勾选状态) 2.勾选需要合批的静态物体上的Batching Static项,勾选后此物体下的所有子物体都默认参与静态合批(勾选后物体不能进行移动/旋转/缩放操作,…

C#,入门教程(06)——解决方案资源管理器,代码文件与文件夹的管理工具

上一篇: C#,入门教程(05)——Visual Studio 2022源程序(源代码)自动排版的功能动画图示https://blog.csdn.net/beijinghorn/article/details/124675293 大家平时都怎么管理源代码与文件夹呢?世界上最好的集成开发环境…

TinyEMU编译与使用(一)

TinyEMU编译与使用(一) 1 介绍2 准备工作3 编译TinyEMU3.1 安装依赖库3.2 编译 4 运行TinyEMU4.1 在线运行4.2 离线运行 5 共享目录5.1 修改root_9p-riscv64.cfg5.2 启动TinyEMU5.3 执行挂载命令 6 TinyEMU命令帮助 1 介绍 原名为riscvemu,于…

Oracle 的同义词(Synonym) 作用

Oracle 同义词(Synonym) 是数据库对象的一个别名,Oracle 可以为表、视图、序列、过程、函数、程序包等指定一个别名。同义词有两种类型: 私有同义词:拥有 CREATE SYNONYM 权限的用户(包括非管理员用户)即可创建私有同义词,创建的…

43. 【Linux教程】创建分区

前面小节介绍了文件系统,本小节介绍如何创建分区,创建分区之后就可以用来容纳文件系统。 1. 硬盘分区介绍 Linux 磁盘分区主要分为基本分区(primary partion)和扩充分区 (extension partion) 两种,基本分区和扩充分区…

Web-Check网站检查工具

Web-Check是一款网站检查工具,通过该工具,能够查看网站的各种关键数据,包括 DNS 记录、服务器位置、SSL 证书等方面的信息 开源地址 https://github.com/Lissy93/web-check 部署 docker run -d --name web-check -p 3000:3000 lissy93/web…

嵌入式系统是什么?Linux应用开发是开发什么的?

第一篇: 原文链接:https://www.zhihu.com/question/464205608/answer/3358027187 一、什么是嵌入式系统 嵌入式系统是以应用为中心,以计算机技术为基础,软硬件可裁剪,适用于应用系统,对功能、可靠性、…

比较 2 名无人机驾驶员:借助分析飞得更高

近年来,越来越多的政府和执法机构使用无人机从空中鸟瞰。为了高效执行任务,无人机必须能够快速机动到预定目标。快速机动使它们能够在复杂的环境中航行,并高效地完成任务。成为认证的无人机驾驶员的要求因国家/地区而异,但都要求您…

Web组态可视化编辑器 快速绘制组态

随着工业智能制造的发展,工业企业对设备可视化、远程运维的需求日趋强烈,传统的单机版组态软件已经不能满足越来越复杂的控制需求,那么实现Web组态可视化界面成为了主要的技术路径。 行业痛点 对于软件服务商来说,将单机版软件转变…

易经智慧解码数字化转型:象数理视角下的未来探索

在数字化浪潮席卷全球的今天,我们不禁思考:国学《易经》的智慧如何与现代的数字化转型相结合,为我们提供独特的洞见和启示?今天我们从易经的象、数、理三个层面,浅析数字化转型的内在逻辑和发展趋势。 象:数…

Python打发无聊时光:14.用PyQt创建一个简易的串口调试助手

第一步:装pyqt5和pyserial库 pip install pyqt5 pyserial 第二步:完整代码 import sys from PyQt5.QtWidgets import QApplication, QMainWindow, QPushButton, QVBoxLayout, QWidget, QLabel, QComboBox, \QGridLayout, QLineEdit, QTextEdit from P…

酷开科技以酷开系统为媒介,打造欢乐生活场景

家人相聚在一起的时光总是那么美好,在欢聚的日子里,我们也总是希望能够让时间变得慢一点,再慢一点,但是随着春节假期的结束,很多人已经开始了新一年的忙碌,大家纷纷回到工作、学习岗位,回归之前…

Java面试题【必知必会】Mybatis常见面试题(2024)

近期一直在准备面试,所以为了巩固知识,也为了梳理,整理了一些java的基础面试题!同时也希望各位英雄和女侠能够补充!不胜荣幸!!! 1.MyBatis是什么?他的优缺点?…

第八篇 - 预测受众(Predictive audience)技术是如何赋能数字化营销生态的?- 我为什么要翻译介绍美国人工智能科技巨头IAB公司

IAB平台,使命和功能 IAB成立于1996年,总部位于纽约市。 作为美国的人工智能科技巨头社会媒体和营销专业平台公司,互动广告局(IAB- the Interactive Advertising Bureau)自1996年成立以来,先后为700多家媒…

快递通cps小程序源码

源码介绍: 快递代发快递代寄寄件小程序可以对接易达云洋一级总代快递小程序,接入云洋/易达物流接口,支持选择快递公司,三通一达,极兔,德邦等,功能成熟 如何收益: 1.对接第三方平台成本大约4元…