数据分析概要【数据分析---偏企业】

news2024/9/17 8:27:44
各位大佬好 ,这里是阿川的博客,祝您变得更强

在这里插入图片描述 个人主页:在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力在这里插入图片描述

阿川水平有限,如有错误,欢迎大佬指正在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

数据分析概要前 必看
Python 初阶
Python–语言基础与由来介绍
Python–注意事项
Python–语句与众所周知
数据分析系列文章 偏学术
数据分析—技术栈和开发环境搭建
数据分析—Numpy和Pandas库基本用法及实例
数据分析—三前奏:获取/ 读取/ 评估数据
数据分析—数据清洗操作及众所周知
数据分析—数据整理操作及众所周知
数据分析—统计学基础及Python具体实现
数据分析—数据可视化Python实现超详解
数据分析—推断统计学及Python实现
数据分析—线性及逻辑回归模型
数据分析—AI交互及爬虫
大数据导论 知识
【大数据导论】—大数据序言
【大数据导论】—大数据、人工智能、云计算、物联网、区块链序言
【大数据导论】—大数据基础知识

目录

  • 数据概念
  • 数据类别
  • 数据四大优势
  • 数据分析概念
  • 数据岗位区别
  • 数据分析适用场景
  • 数据分析步骤
  • 数据分析框架
  • 数据分析中的可视化
  • 学习经验分享

数据概念

数据

  • 客观事件进行记录可以鉴别符号
  • 构成信息基本单位

在这里插入图片描述

数据类别

  • 数值型数据
    数字组成的变量
    在这里插入图片描述

  • 类别型数据
    由各种字符串分组标签组成
    在这里插入图片描述

数据四大优势

  • 反复读取和使用
  • 客观
  • 量化
  • 机器可处理
    在这里插入图片描述

数据分析概念

只要是基于量化的信息 提升生产力就是数据分析
在这里插入图片描述

数据岗位区别

基于业务

  • 数据专员
  • 数据运营
  • 数据分析师

基于开发

  • 数据工程师
  • 数据产品经理

基于算法

  • 算法优化师
  • 算法科学家
  • 算法工程师

在这里插入图片描述

数据分析适用场景

四大类

  • 数据去量化企业当前的经营现状或者业务事实
    在这里插入图片描述

  • 探究各种数据上差距异常,寻找背后的成因
    在这里插入图片描述

  • 搞清楚成因后给出具体的行动策略
    在这里插入图片描述
    方法
    在这里插入图片描述
    在这里插入图片描述

  • 计算使当前策略投入产出比最高过程参数
    在这里插入图片描述
    方法
    在这里插入图片描述

数据分析步骤

  • 思考 问题
  • 处理 数据
  • 输出 结论

在这里插入图片描述

  • 其中思考问题
    在这里插入图片描述

    • 发现问题

    • 定义问题

    • 选择问题

    • 确认问题

      • 目的
      • 背景
      • 思路
        在这里插入图片描述
        解决方法例子
        在这里插入图片描述
        注意 一定要检查数据准确性,若数据过于异常,还要检查一下数据的处理与计算
    • 拆解问题
      初学阶段学习大量经典分析框架,再搭建自己的分析矩阵
      成熟分析师搭建自己的分析矩阵,对问题全方位地拆解高效地找到答案
      在这里插入图片描述

    • 量化问题

      • 数据格式
        • 日期
        • 字符串
        • 数字
          在这里插入图片描述
          注意统一统计口径,即什么时候一个数据才算有效数据

其中处理数据

  • 收集数据
    • 内部数据
      • 直接写SQL
      • 从平台下载
      • 提数据需求
        • 从生产环境同步
        • T+1更新
    • 外部数据
      • 来源:各大网站和APP
      • 获取方式:爬虫和API

爬虫常用工具八爪鱼后羿采集器或者Python中的爬虫工具包
在这里插入图片描述

  • 处理数据
    将各种脏数据通过筛选、清洗和计算处理成干净数据
    在这里插入图片描述

  • 制作图表
    清洗过的标准数据借助工具 处理成我们需要的各种图表
    在这里插入图片描述

  • 上传发布
    将我们的图表发布成一个个可以访问页面
    在这里插入图片描述

  • 输出结论
    一句话一幅图
    在这里插入图片描述

数据分析框架

在这里插入图片描述
其中五大基础理论

一、大数定律

大量重复某一实验时最后的频率会无限接近于事件的概率,即数据的样本量越大预测和计算的概率就越准确
在这里插入图片描述

启发:对小样本量的分析结果保持客观的怀疑与观察,并尽可能地在大样本量下进行分析
二、罗卡定律
凡有接触必有痕迹不要放弃挖掘更多数据
在这里插入图片描述

启发:用户的一切行为都会留下数据,尽可能的拿来分析找到数据背后隐藏的价值
三、幸存者偏差
统计样本覆盖,会很大程度上直接影响分析的结果,即各种分析对象取全量 尽量取全量
在这里插入图片描述

启发:分析时要提前检查取样偏差,分析的样本要越能代表整体越好

四、辛普森悖论
两组分别讨论都满足某一性质的数据,一旦合并计算得出完全相反的结论
在这里插入图片描述

启发确保数据同一量级和权重下进行分析
五、帕累托最优
进行资源分配中不增加资源通过调整分配方式,使整体的效率最大化
在这里插入图片描述

启发:在不投入资源的情况下,也总有优化现状的方法

其中一法则四方法
MECE法则
要求拆解出的各个部分都要满足相互独立完全穷尽
在这里插入图片描述

时间流程法
根据时间顺序问题进行拆解
在这里插入图片描述

经典AARRR模型
A—获取
A—激活
R—留存
R—收益
R—传播
在这里插入图片描述

该模型可以根据公司的具体业务进行细分
经典两大框架

  • PDCA
    强调做事情一定要先规划再执行
    P—计划
    D—执行
    C—检查
    A—处理
    在这里插入图片描述

  • 精益创业
    强调 根据想法快速构建产品,并基于数据反馈快速迭代创业
    在这里插入图片描述

模型框架法
基于几个完全平行的维度,对问题进行划分

  • SWOT法

    • SO战略
      依靠内部优势
    • WO战略
      利用外部机会
      克服内部弱点
    • ST战略
      利用内部优势
      抵制外部威胁
    • WT战略
      减少内部弱点
      回避外部威胁
      在这里插入图片描述
  • RFM法
    根据不同的维度,对客户划分成8个区间
    在这里插入图片描述

量化公式法
解决涉及到指标计算的问题
在这里插入图片描述

将问题量化成指标步骤

  • 根据拆解的维度找到对应的数据指标
  • 基于现有的数据指标进行发散的思考
    在这里插入图片描述

常见的指标三类
属性:描述分析对象有哪些特征
绝对值:衡量一件事最后的结果
转换率:衡量一个环节的完成度
在这里插入图片描述

穷尽要素法
整体分为不同的构成部分
在这里插入图片描述

例如:电商平台将消费人群划分成八大人群
在这里插入图片描述
其中业务诊断

业务诊断通常用时间流程法、模型框架法、量化公式法、穷尽要素法四大分析方法一起上,对问题进行拆解、量化、取数、分析
在这里插入图片描述

其中业务增长

  • 收集外部数据
  • 估算市场空间
  • 推算竞品规模
  • 计算增长空间
  • 确定增长目标
  • 研究主流打法
  • 设计增长策略
  • 构建增长引擎
  • 计算增长成本
  • 核心指标选取
  • 业务动作梳理
  • 指标体系搭建
  • 数据实验设计
  • 专项策略输出
  • 梳理可行方案
  • 数据实验迭代
  • 达到增长目标
    在这里插入图片描述

数据分析中的可视化

取数作图
在这里插入图片描述

  • 可视化原理

  • 经历的环节

  • 数据工具

    • Excel 小量级一次性数据处理
    • Tableau、Power BI等BI工具 批量数据读取与分析
    • Python 复杂的数据清洗、爬虫和算法建模
      在这里插入图片描述

    注意:若不灵活学习和使用新工具,最终都会限制自身的发展
    在这里插入图片描述

数据表达
基于数据化表、图、文 说明事实表达观点,从而更好地说明现状阐述事实,使人能基于数据准确地知道到底发生了什么用数据说服他人认同我们自己想表达的观点
在这里插入图片描述
在这里插入图片描述
数据表达的原则

  • 客观
  • 直观
  • 高效
    在这里插入图片描述

数据表达的载体和形式
在这里插入图片描述

  • 基于PPT汇报总结

  • 基于文档专业分析

  • 基于图文沟通对话
    表达格式:观点+数据+补充信息+图表
    在这里插入图片描述
    其中
    在这里插入图片描述

    1. 提炼文字观点

      • 打破认知
      • 语出惊人
    2. 制作完善图表

      • 根据问题和观点选择合适的图表类型

      • 为图表准备数据
        对观点拆解量化,然后梳理出数据,并且收集处理为数据库中的标准数据

      • 通过工具制作图表

      • 优化视觉图形组合
        制作出有效信息密度更大高效图表
        在这里插入图片描述
        在这里插入图片描述
        图形总结

        • 比数字规模,上柱状图

        • 多对象,上条形图
          在这里插入图片描述

        • 数据趋势,上折线图

        • 多个对比对象,上多个折线图
          在这里插入图片描述

        • 各类占比分析,上饼图/环形图

        • 多对象占比,上树图
          在这里插入图片描述

        • 两个度量上对比一个维度,上散点图
          在这里插入图片描述

        • 单一度量分布,上直方图

        • 地理位置相关,上地图
          在这里插入图片描述

      即图表类型分类主要是从规模、趋势、占比、关系、分布
      在这里插入图片描述

    3. 提出关键数据

      • 日期时间准确
        时间日期要准确说明年月日
      • 简化数字
        对于大数据和小数点过长的数据,要四舍五入,并给出合适量级的单位
      • 少用术语
        要视对象使用术语和缩略语,不要跟业务拽专业指标,也不要跟技术说行业黑话
      • 多说大白话
        语言表述越直白越简单越好不要兜圈子
        在这里插入图片描述

学习经验分享

  1. 充分理解别人学习框架
  2. 已有框架 能不能解决问题
  3. 果断学习新知识解决问题
  4. 学会后归纳到自己的框架里
  5. 甚至放弃原有框架重新搭建一个
    在这里插入图片描述

在进行数据分析时,反复问自己三个问题:
一、输出结论能不能理解
二、做出的图表 够不够直观
三、给出的策略 可不可执行
在这里插入图片描述

注意:在数据分析领域中面对众多方向先学自己用得上的技能和知识

数据分析与问题本身关系

  • 只有乐于解决问题
  • 才会善于解决问题
  • 当善于解决问题
  • 就没有难解的问题
    在这里插入图片描述

注意:在解决问题中一定不能只看量化的数据大量非量化的业务细节和信息,甚至连一线执行时的情绪都是不可忽略的,它们往往才是最终决定你的分析和策略 是否能真正落地实现价值的关键
在这里插入图片描述

好的,到此为止啦,祝您变得更强

在这里插入图片描述
想说的话

学习来源B站戴师兄(反反复复学习了3遍哈并且做了相应的笔记/相应的练习 然后才进行的这篇博客的书写)实不相瞒,写的这篇博客要写八个小时以上(加上自己学习和纸质笔记,共十小时吧),很累希望大佬支持一下

在这里插入图片描述

道阻且长 行则将至
个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1960715.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[数据集][目标检测]易拉罐底部缺陷检测数据集VOC+YOLO格式1122张5类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):1122 标注数量(xml文件个数):1122 标注数量(txt文件个数):1122 标注…

企业获客重要途径-大数据获客系统

企业获客的重要途径之一是通过大数据获客系统。这一系统利用大数据技术和分析方法,帮助企业更精准地获取客户,提高市场营销的效率和效果。 所以整理了以下是大数据获客系统作为企业获客重要途径的详细阐述: 一、大数据获客系统的定义与功能…

永磁同步电机谐波抑制算法(8)——基于自适应带宽扩张状态观测器的采样电流偏置误差补偿办法

1.前言 在上一期内容中,已经介绍了采样电流的偏置误差the current measurement offset error /CMOE(这个采样电流偏置误差通常认为是直流DC偏置,所以其在dq电流中会造成一次谐波)。如果没看过上一期内容,那先需要补一…

SSRF-labs-master靶场

目录 file_get_content.php sql_connect.php download.php dns-spoofing.php dns_rebinding.php 访问链接 http://127.0.0.1/SSRF/# file_get_content.php 在编程语言中,有一些函数可以获取本地保存文件的内容。这些功能可能能够从远程URL以及本地文件 如果没…

C++第二十九弹---C++继承机制深度剖析(上)

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】 目录 1.继承的概念及定义 1.1继承的概念 1.2 继承定义 1.2.1定义格式 1.2.2继承关系和访问限定符 1.2.3继承基类成员访问方式的变化 2.基类和派生…

常见的手电筒芯片功能模式选型 单路双路可用

常见的手电筒芯片如下 单双路输出 带充电功能和不带充电功能的 外围结构简单、无需多余的元器件 搜恒森宇电子了解更多相关功能! 首页

Spring随笔

Spring随笔 BeanFactory和ApplictionContextbean增强 AutowiredAnnotationBeanPostProcessor工厂增强 BeanFactory和ApplictionContext BeanFactory装载了bean实例,一个容器,提供了对bean的增删改查 ApplictionContext继承了factory,除此之外…

MyBatis基础配置

一、M y B a t i s 配 置 文 件 1.为什么学习MyBatis配置文件 功能:构建SqlSessionFactory的依据。 意义:MyBatis最为核心的内容,对MyBatis的使用影响很大。 注意:配置文件的层次顺序不能颠倒,一旦颠倒会出现异常。 …

NLP与搜广推常见面试问题

1 auc指标 AUC的两种意义 一个是ROC曲线的面积另外一个是统计意义。从统计学角度理解,AUC等于随机挑选一个正样本和负样本时,模型对正样本的预测分数大于负样本的预测分数的概率。下图为搜广推场景下的一个计算auc的例子

如何查找OBS的终端节点(Endpoint)和访问域名

目录 一、参考链接二、终端节点(Endpoint)三、访问域名 一、参考链接 https://support.huaweicloud.com/productdesc-obs/obs_03_0152.html 二、终端节点(Endpoint) OBS为每个区域提供一个终端节点,终端节点可以理解…

JVM性能调优全指南:高流量电商系统的最佳实践

1.G1(Garbage-First) 官网: G1 Garbage Collection G1收集器是Java 7中引入的垃圾收集器,用于替代CMS(Concurrent Mark-Sweep)收集器。它主要针对大内存、多核CPU环境下的应用场景,具有以下特点: 分代收集:G1仍然保留了分代的概念,但新生代和老年代不再是物理隔离的,…

37 列表推导式

列表推导式(list comprehension) 也成为列表解析式,可以使用非常简洁的方式对列表或其他可迭代对象的元素进行遍历、过滤或再次计算,快速生成满足特定需求的新列表,代码非常简洁,具有很强的可读性,是 pytho…

抖音视频素材网站有哪些?非常好用的5个抖音视频素材库分享

在打造引人入胜的抖音视频时,选择高品质的视频素材至关重要。优选的素材不仅能够显著提升视频的吸引力,还能让你的作品在众多视频中突出重围。对于抖音创作者而言,让我们探索一些备受推崇的视频素材平台,帮助你制作出既专业又引人…

C:操作符介绍-学习笔记

目录 引言&#xff1a; 1、操作符的分类&#xff1a; 2、原码&#xff0c;反码&#xff0c;补码 2.1 介绍 2.2 作用 3、移位操作符&#xff1a;>>、 << 3.1 左移操作符 &#xff1a;<< 3.1.1 正整数移动 3.1.2 负整数移动 3.2 右移操作符&#xff…

Unity GameObject学习笔记

GameObject成员变量 GameObject静态方法 //准备用来克隆的对象//1.直接是场景上的某个对象//2.可以是一个预制体对象public GameObject Myobj; #region 知识点二 GameObject中的静态方法创建自带几何体只要得到了一个GameObject对象 我就可以得到它身上挂载的任何脚本信息GameO…

YotoR(You Only Transform One Representation)

本文介绍了一种名为YotoR&#xff08;You Only Transform One Representation&#xff09;的新型深度学习目标检测模型。该模型将Swin Transformers与YoloR架构相结合。在自然语言处理领域引起革命的Transformer技术&#xff0c;如今同样对计算机视觉产生了深远影响&#xff0c…

7.29 模拟赛总结 平面图欧拉定理

复盘 7:40 开题 开题失败&#xff0c;由于前一天有 cf&#xff0c;模拟赛移到下午了 13:45 开题 看 T1&#xff0c;题意很抽象&#xff0c;理清后发现&#xff1a;这直接 dj 不就行了&#xff1f;不会错吧不会错吧&#xff0c;看着 n 1000 n1000 n1000 的数据范围还是不确…

java实现权重轮询算法

package com.example.demo.demos.web.nginx;import java.util.ArrayList; import java.util.List;public class WeightedRoundRobin {private static List<Server> servers new ArrayList<>(); // 存储服务器的列表private static int currentIndex -1; // 当前服…

APP测试基本流程以及APP测试要点梳理,成功入职就靠它了

&#x1f525; 交流讨论&#xff1a;欢迎加入我们一起学习&#xff01; &#x1f525; 资源分享&#xff1a;耗时200小时精选的「软件测试」资料包 &#x1f525; 教程推荐&#xff1a;火遍全网的《软件测试》教程 &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1…

【MATLAB源码-第161期】基于matlab的OQPSK系统仿真,输出误码率曲线图,眼图以及各节点信号图像对比。

操作环境&#xff1a; MATLAB 2022a 1、算法描述 正交四相移相键控&#xff08;OQPSK&#xff0c;Orthogonal Quadrature Phase Shift Keying&#xff09;是一种数字调制技术&#xff0c;它在传统的QPSK&#xff08;Quadrature Phase Shift Keying&#xff0c;四相移相键控&…