~数据分析知识分享~

news2024/9/21 18:01:20

近来有一些小伙伴咨询数据分析相关的一些知识内容 我收集了一些相关信息 在这里简单做一些分享和介绍,后续有相关的内容我也会持续的更新!感谢大家的支持与陪伴!

拆解问题一个原则四类方法

数据分析工程技术

数据分析四种类型 六个方向 + 分析师层级

万能问题确认公式

数据分析认知知识点

  • 数据自身三大属性
    • 客观
    • 量化
    • 机器可处理
  • 数据建设的七个层级
    • 凭感觉
    • 看数字
    • 用表格
    • 搭系统
    • 建数仓
    • 中心化
    • 智能化
  • 数据分析实际价值
    • 个人价值
      • 效率提升
    • 公司价值
      • 映射现状,及时反馈
      • 统一认知,加强协作
      • 算法基础,自动生产
    • 时代价值
      • 数据是一切科学研究的基础
  • 数据分析的实现原理
    • 数据分析解决问题的原理
      • 业务中的数据分析是为了更好的解决现实问题
      • 传统:问题发生——结合现实——逻辑推理——得出结论
      • 数据:问题发生——结合现实——数据映射——量化分析——得出结论
    • 数据分析实现的具体流程
      • 定义问题
        • 明确范围
        • 拆解问题
      • 准备数据
        • 获取数据
        • 清洗数据
        • 处理数据
        • 验证数据
      • 分析数据
        • 分析的目的
          • 业务分析:关注数据与业务的关联性、映射关系和可解释性
            • 常规计算
            • 数据可视化
            • 归纳/演绎
          • 建模分析:关注数据的整体特征(特征决定上限,模型调参无限趋近于上限)
            • 机器学习建模
            • 深度学习挖掘
        • 分析的种类
          • 计算型分析
            • 统计学
            • 机器学习
          • 逻辑型分析
            • 归纳/演绎
            • 思维模型
      • 得出结论
        • 假设性结论
        • 初步传递结论
        • 得到新的反馈
        • 验证/推翻结论
      • 应用数据
        • 策略+实施:业务解决问题
        • 监控+预警:自动发现问题
        • 算法+部署:自动解决问题
    • 数据分析实现所需的技术
      • 埋点采集
        • (1)传感器
        • (2)系统日志采集方法
        • (3)Web爬虫
      • 传输存储
        • 传输
          • 借助网络
        • 存储
          • 借助数据库技术
          • 研究如何组织和存储数据。如何高效的获取和处理数据
          • 存储是一门大学问
            • 速度
            • 准确性
            • 最大规模
            • 数据种类
      • 提取回流
        • 提取
          • 查询
          • 导出
        • 回流
          • 数据被操作过后,怎么回到数据库,继续参与生产和建模
      • 清洗处理
        • 清晰
          • 符合数据标准
        • 处理
          • 符合实际需求
      • 连接导入
        • 怎么对接到不同的工具和软件,涉及到各种中间键和协议
      • 分析建模
        • 分析
          • 计算
          • 图表
        • 建模
          • 机器学习
          • 深度学习
      • 部署应用
        • BI监控
        • 算法平台
          • 先知
        • 工程开发
    • 数据分析的职业发展
      • 三个层级(四种类型六个方向分析师层级图)
        • 接需求 = 工具人
          • 即插即用,把工具练到极致
        • 背指标 = 对业务负责的分析师
          • 不对业务结果负责的分析本质上没有任何意义
          • 想要做好分析师就要深入业务场景,对业务负责
        • 做研究 = 数据科学家
          • 研究准确率更高的算法框架
          • 提供效率更好性能更好的数据技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2127248.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[000-002-01].第03节:Linux系统下Oracle的安装与使用

2.1.Docker安装Oracle 在CentOS7中使用Docker安装Oracle: 1.安装Docker,详细请参考:https://blog.csdn.net/weixin_43783284/article/details/1211403682.拉取镜像: docker pull registry.cn-hangzhou.aliyuncs.com/helowin/oracle_11g3.下载…

Zookeeper下载与安装教程(国产化生产环境无联网服务器部署实操)

请放心观看,已在正式环境部署验证,流程无问题! 此外,建议更换默认的2181端口,避免后期服务器漏扫麻烦,不少漏扫软件是扫描到默认端口后给出漏洞报错!我所用服务器环境是麒麟银河aarch64系统&am…

Navicat 17 新特性 | 聚焦 MongoDB

随着 Navicat 17 的盛大发布,其一系列创新特性赢得了广大用户的热烈反响。它不仅在模型设计上实现了突破性优化,提升了查询与配置的效率,还大幅优化了用户界面的交互体验,原生支持国产平台与操作系统,同时增强 BI 能力…

UE场景根节点非静态 Landscape Root Component is Not Static 问题解决

错误截图 RenderQueue(影片渲染队列)渲染卡顿、黑屏,打开log查看到如下图所示报错: 错误原因 一种错误原因是你在操作sequence时无意中把landscape写入到了sequence中,有变换(transform)轨道…

MySql注入之Bypass总结

在真实的渗透测试环境中,经常会遇到被WAF拦截的情况,如果不知道怎么绕过WAF,想要继续渗透就很难了,因此,今天来总结一下 mysql 注入时,如何绕过WAF。 一、测试环境 集成环境: phpStudy数据库: mysql 5.7H…

第十八节:学习统一异常处理(自学Spring boot 3.x的第五天)

这节记录下如何通过AOP方式统一处理异常拦截。 第一步: 新建一个exception包,创建一个ExcetionHandler.java(名字随意取) package cn.wcyf.wcai.exception;import cn.wcyf.wcai.common.Result; import org.springframework.web…

双顶堆算法求中位数——从LeetCode题海中总结常见套路

前言:双顶堆算法求是非常经典的一种求中位数算法,是堆必知必会的经典知识点。具体来说,就是如何求出数据流中的中位数。数据流的特点是高速插入,数据会不断涌入结构中,那么也就面临着需要多次动态调整以获得中位数。我们需要保证最大效率的情况下求出中位数,当然不能全部…

Pycharm 输入三个引号没有自动生成函数(方法)注释

配置项路径:pycharm–>Settins–>Tools–>Python Integrated Tools–>Docstrings–>Docstrings format选择对应的工程,如果有多个工程的话将 Docstrings format 的值从 Plain 换成 reStructuredText

Jupyter Notebook | 安装 rise 插件后显示幻灯片失败

目录 1 问题描述2 解决步骤 1 问题描述 下图目录中的 .ipynb 文件都能以幻灯片的形式展现: 但是跟着 03 安装【动手学深度学习v2】 安装好 rise 插件后,并不能进入幻灯片模式。后来发现是 Jupyter Notebook 版本和 Python 版本不匹配的问题&#xff…

全国历年高考真题2008-2024

目录 分享链接: ⬇️⬇️⬇️ 点击下载

2024.9.11 作业

使用绘制事件完成钟表的绘制 源文件 #include "widget.h" #include "ui_widget.h" #include <QDateTime> //日期事件类 #include <QTimer> #include <QDebug>Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget…

AI论文精读笔记-Generative Adversarial Nets(GAN)

1. 论文基本信息 论文标题&#xff1a;Generative Adversarial Nets 作者&#xff1a;Ian J. Goodfellow,∗ Jean Pouget-Abadie,† Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair,‡ Aaron Courville, Yoshua Bengio 发表时间和期刊&#xff1a;2014.06&#xf…

Java数据结构(十)——冒泡排序、快速排序

文章目录 冒泡排序算法介绍代码实现优化策略复杂度和稳定性 快速排序算法介绍优化策略非递归实现代码演示复杂度和稳定性 冒泡排序 算法介绍 冒泡排序是一种简单的排序算法。它重复地遍历要排序的数列&#xff0c;一次比较两个元素&#xff0c;如果它们的顺序错误就交换。遍历…

【FICO】SAP财务模块中的统驭科目及特别总账详解

前言 统驭科目作为SAP FICO财务模块中专有的一个概念&#xff0c;很好地展示了SAP ERP系统在设计模式中的精妙性。在本文中&#xff0c;笔者将详细地介绍统驭科目的设计初衷&#xff0c;作用以及如何在系统中进行使用。 统驭科目的设计初衷 统驭科目是如何进行核算的&#xff…

【python】OpenCV—Age and Gender Classification

文章目录 1、任务描述2、网络结构2.1 人脸检测2.2 性别分类2.3 年龄分类 3、代码实现4、结果展示5、参考 1、任务描述 性别分类和年龄分类预测 2、网络结构 2.1 人脸检测 输出最高的 200 个 RoI&#xff0c;每个 RoI 7 个值&#xff0c;&#xff08;xx&#xff0c;xx&#x…

LeetCode - 17 电话号码的字母组合

题目来源 17. 电话号码的字母组合 - 力扣&#xff08;LeetCode&#xff09; 题目描述 给定一个仅包含数字 2-9 的字符串&#xff0c;返回所有它能表示的字母组合。答案可以按 任意顺序 返回。 给出数字到字母的映射如下&#xff08;与电话按键相同&#xff09;。注意 1 不对…

共享单车轨迹数据分析:以厦门市共享单车数据为例(三)

本篇文章将视角聚焦于共享单车的出行距离和时间分布&#xff0c;为了更好地理解共享单车在特定时间段内的使用情况及用户行为特征&#xff0c;本文基于2020年12月21日上午06:00至10:00期间收集的共享单车订单数据进行了详细的分析&#xff0c;旨在探索共享单车在该时间段内的出…

Centos7 Hadoop 单机版安装教程(图文)

本章教程,主要记录如何在Centos7中安装Hadoop单机版。 一、软件安装包和基础环境 CentOS7.x,jdk8,hadoop 通过网盘分享的文件:Hadoop 链接: https://pan.baidu.com/s/1_qGI9QeXMAJNb3TydHhQGA?pwd=xnz4 提取码: xnz4 当然你也可以自己去官网下载。 java8:https://www.ora…

【Python第三方库】OpenCV库实用指南

文章目录 前言安装OpenCV读取图像图像基本操作获取图像信息裁剪图像图像缩放图像转换为灰度图图像模糊处理边缘检测图像翻转图像保存 视频相关操作方法讲解读取视频从摄像头读取视频 前言 OpenCV&#xff08;Open Source Computer Vision Library&#xff09;作为一个强大的计…

使用docker配置wordpress

docker的安装 配置docker yum源 sudo yum install -y yum-utils sudo yum-config-manager \ --add-repo \ http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo下载最新版本docker sudo yum install -y docker-ce docker-ce-cli containerd.io docker-buildx-…