何为数据分析?数据分析流程是啥?

news2025/1/12 23:13:11

一、什么是数据分析

指用专业的统计分析方法对大量数据进行分析,并加以详细研究和概括总结,提取有价值的信息,形成有效的分析结论,从而影响业务决策

二、数据分析的重要性

一切事物,如果不能量化它,我们就没法真正理解它;如果不能理解它,我们就没法真正控制它;如果不能控制它,我们就没法真正改变它。

在大数据时代,人类大脑无法理解的复杂,而数据分析可以解读其中的含义;面对难以掌控的未知因素,而数据分析可以预测其中的规律。

数据分析能够弥补我们对直觉的过分自信,更科学合理地思考问题和做决策。

在这里插入图片描述

三、数据分析的作用

现状分析,过去发生了什么?例如通过描述性统计诊断业务状况

原因分析,为什么会发生?例如通过维度拆解和指标拆解等分析方法,并结合实际业务,寻找业务异常点

预测分析,将来可能发生什么?例如根据用户行为数据预测是否即将流失,并对即将流失的用户采取挽留措施

四、如何数据分析?

1.明确分析目的与思路

思路决定结果,必须明确数据分析目的,形成清晰的思路框架,避免为了分析而分析

2.数据收集

基于分析目的去收集相关的数据集,大部分为公司的内部数据,也可能涉及外部数据

  • 关系型管理数据库(RMDB,利用SQL语言取数),数据仓库(WareHouse,利用HiveSQL取数)
  • 文件:excel、csv、txt等
  • 系统/平台:手动导出、selenium等python自动化脚本
  • 互联网:网络爬虫
  • API:requests请求库、解析json文件等

3.数据清洗

将数据整理成整洁干净并利于接下来分析的结构和格式,数据可能分布得比较零散,需要对各类数据集进行集成

异常值、错误值、缺失值处理
字段的拆分、合并、信息提取、格式转换等
表关联:左、右、外(全)、内连接、笛卡尔积表等(左半、左反连接等)
表结构转换:行转列(长表转宽表)、列转行(宽表转长表等)、行列转置、数据透视(逆透视)

在这里插入图片描述

4.数据分析

需要掌握常用的分析方法和机器学习算法

  • 基本分析方法:构成分析、对比分析、分组分析、交叉分析、趋势分析等
  • 高级分析方法:线性回归、逻辑回归、决策树、随机森林、聚类等算法

5.数据可视化

将分析观点用图表的形式呈现出来

  • 字不如表,表不如图,一图胜千言
  • 基本统计图表:饼图、条形图、折线图、散点图、雷达图、漏斗图等
  • 专业统计图表:直方图、热力图、箱线图、提琴图、核密度估计图等

6.数据分析报告

将重要的分析结论和发现汇总成PPT,形成一份完整的数据分析报告

  • 金字塔结构,总分总形式
  • 结论先行、由上而下、归纳分组、逻辑递进
  • 结构清晰,层次分明,突出重点,明确要点

7.数据应用

  • 将可行性的建议方案应用到实际业务场景,并解决公司的实际业务问题
  • 为业务决策提供数据支持,实现数据驱动业务增长

四、数据分析工具

工欲善其事必先利其器,需要掌握的主流数据分析工具

  • Excel,非常重要的基础
  • PowerBI/Tableau,强大的商业智能BI工具
  • SQL,必备的数据库数据查询语言
  • Python,人工智能的首选计算机语言

关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

👉Python学习路线汇总👈

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(全套教程文末领取哈)
在这里插入图片描述

👉Python必备开发工具👈

在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉Python学习视频600合集👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

在这里插入图片描述

👉实战案例👈

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉100道Python练习题👈

检查学习结果。
在这里插入图片描述

👉面试刷题👈

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

资料领取

上述这份完整版的Python全套学习资料已经上传CSDN官方,朋友们如果需要可以微信扫描下方CSDN官方认证二维码输入“领取资料” 即可领取

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/379543.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Allegro如何手动让静态铜皮避让过孔操作指导

Allegro如何手动让静态铜皮避让过孔操作指导 在用Allegro做PCB设计的时候,如果铺的是静态铜皮,铜皮铺在过孔上会造成短路,需要手动避让下,如下图 下面介绍如何手动避让,具体操作如下 点击Shape点击Manual Void/Cavity

itop-3568开发板驱动学习笔记(3) 字符设备(上)

《【北京迅为】itop-3568开发板驱动开发指南.pdf》 学习笔记 文章目录字符设备简介申请字符设备号注册字符设备创建设备节点字符设备驱动框架(实验)杂项设备字符设备简介 字符设备是指在I/O传输过程中以字符为单位进行传输的设备,例如键盘&am…

如何使用ApacheTomcatScanner扫描Apache Tomcat服务器漏洞

关于ApacheTomcatScanner ApacheTomcatScanner是一个功能强大的Python脚本,该脚本主要针对Apache Tomcat服务器安全而设计,可以帮助广大研究人员轻松扫描和检测Apache Tomcat服务器中的安全漏洞。 功能介绍 1、支持使用多线程Worker搜索Apache Tomcat服…

ARM简介及其发展历史

前言ARM名声很大,最近在学习STM32,也借机梳理一下关于ARM的各种概念和信息。 本文主要内容:ARM一词的含义,ARM的发展历史,ARM cortex系列处理器简介与ARM在不同市场的应用情况。 一. ARM一词的4种含义1.1 ARM公司 AR…

如何外网登录访问瑞友天翼应用虚拟化系统?——快解析内网端口映射方案

瑞友天翼应用虚拟化系统(GWT System)是国内具有自主知识产权的应用虚拟化平台,是基于服务器计算(Server-based Computing)的应用虚拟化平台。如何将内网平台提供到互联网上外网访问,是我们比较关注的问题。…

【力扣-10天SQL入门】1~3天刷题 知识点总结

https://leetcode.cn/study-plan/sql/?progressjgmzq5s第1天 选择595. 大的国家无1757. 可回收且低脂的产品枚举类型enumenum是一个字符串对象,用于指定一组预定义的值,并可在创建表时使用,如sex取值为 (male, female, unknown)若要使用条件…

同为(TOWE)电源线让家用电器随心放置

如今,随着科技水平的不断发展,人们工作、生活中越来越离不开各类电子设备和电器产品。当用电器数量多了以后,由于电器设备原有电线长度的限制,常常需要通过连接接线板来延长电器设备的电能传输线路。电源线虽然看着是一件不起眼的…

51单片机定时器使用与计算-----day3

51单片机定时器-----day3 8051单片机介绍: 集成 8位CPU、 4K字节ROM(掉电不丢失)、 128字节RAM(掉电丢失)、 4个8位并口、 1个全双工串行口、2个16位定时/计数器。 寻址范围64K, 并有控制功能较强的布尔处…

MyBatis执行Sql的流程分析

目录 举例 openSession的过程 Executor 简单总结 获取Mapper的流程 Mapper方法的执行流程 doQuery方法 简单总结 举例 public class App {public static void main(String[] args) {String resource "mybatis-config.xml";Reader reader;try {//将XML配置文…

专享策略04 | 商品通用套利模型(二)

量化策略开发,高质量社群,交易思路分享等相关内容 『正文』 ˇ 大家好,去年我们推出了一款套利模型专享策略No.2 | 套利策略-自动换仓-出场加速. 截至到今天创出新高。 大家比较缺少套利,截面,盘口等类型的策略。因此…

「TCG 规范解读」PC 平台相关规范(1)

可信计算组织(Ttrusted Computing Group,TCG)是一个非盈利的工业标准组织,它的宗旨是加强在相异计算机平台上的计算环境的安全性。TCG于2003年春成立,并采纳了由可信计算平台联盟(the Trusted Computing Platform Alli…

SpringBoot集成Knife4j接口管理工具

SpringBoot集成Knife4j接口管理工具1、导入依赖包2、配置Knife4j3、放行Knife4j的请求4、使用Knife4j注解5、实现效果平时开发项目都用的是Swagger2或者Swagger3,但是这两个UI看起来不是很舒服,今天看到了Knife4j,它对Swagger进行了增强&…

华为OD机试题【和最大子矩阵】用 C++ 进行编码 (2023.Q1)

最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试,独家整理 已参加机试人员的实战技巧文章目录 最近更新的博客使用说明和最大…

3.ffmpeg命令行环境搭建、ffmpeg命令行初步了解

在上章,我们讲过: ffmpeg.exe: 主要用于转码或者剪切的应用程序, 也可以从url/现场音频/视频源抓取输入源ffplay.exe: 主要用于播放视频的应用程序,该应用程序源码是开源的,我们后面章节会去源码分析ffprobe.exe: 主要用于分析视频码流的应用程序, 可以获取媒体文件的详细信息,…

Jupyterlab 学习与测试笔记

前言本篇博客主要解决阿里云服务器上Jupyterlab配置方面的一些问题。1、安装完无法启动Jupyterlab首先声明,我在Anaconda3安装过程中已经设置了将安装相关的Python,ipython,Jupyter等添加到环境变量。但是一开始安装完,直接在命令…

从计费出账加速的设计谈周期性业务的优化思考

1号恐惧症 你有没有这样的做IT的朋友?年纪轻轻,就头发花白或者秃顶,然后每个月周期性的精神不振,一到月底,就有明显的焦虑。如果有,他可能就是运营商行业做计费运营的,请对他好点,特…

【LeetCode】剑指 Offer(12)

目录 题目:剑指 Offer 30. 包含min函数的栈 - 力扣(Leetcode) 题目的接口: 解题思路: 代码: 过啦!!! 写在最后: 题目:剑指 Offer 30. 包含m…

【Node.js算法题】数组去重、数组删除元素、数组排序、字符串排序、字符串反向、字符串改大写 、数组改大写、字符替换

文章目录前言数组去重数组删除元素数组排序字符串排序字符串反向字符串改大写数组改大写字符替换字符替换运行结果: ![在这里插入图片描述](https://img-blog.csdnimg.cn/8ac1c15e6f0944cdb8ca50bcb844182a.png)总结前言 本期文章是js的一些算法题,包括…

FreeRTOS入门(07):流缓冲区 消息缓冲区

文章目录目的基础说明流缓冲区相关函数使用演示消息缓冲区相关函数使用演示总结目的 缓冲区是操作系统中常见的一种用于任务间数据传递的机制。这篇文章将对FreeRTOS中相关内容做个介绍。 本文代码测试环境见前面的文章:《FreeRTOS入门(01)…

Flink:The generic type parameters of ‘Collector‘ are missing 类型擦除

类型擦除问题处理报错日志描述问题描述报错解决其他方法方法一:TypeInformation方法二:TypeHint报错日志描述 报错日志: The generic type parameters of Collector are missing. In many cases lambda methods dont provide enough informa…