读书笔记//《数据分析之道》

news2024/11/18 17:25:46

出版时间:2022年
作者曾在互联网大厂做数据分析。从举例可以洞见作者的工作经历。
点评:作者在数据分析领域非常资深,尝试在书中提供一个数据分析工作框架参考。书本内容有点感觉是ppt的集合,辅以案例说明。不过,干货还是很多。

一、数据治理

1、什么是数据治理

数据治理是逐步实现数据价值的过程。具体来说,数据治理是指将零散的用户数据通过采集、传输、储存等一系列标准化流程变成格式规范、结构统一的数据,并构建严格规范的综合数据管控机制;对这些标准化的数据进行进一步加工分析,形成具有指导意义的业务监控报表、业务监控模型,以辅助业务方进行决策。

2、数据治理的流程

在这里插入图片描述
3、数据治理的部分岗位职责

  • 数据分析师:负责数据的即时查询和指标体系、报表体系的建设以及输出各项业务报告;
  • 数据产品经理:负责数据产品原型设计以及推动数据产品的实现和落地;
  • 数据挖掘与算法工程师:基于业务问题开发数据模型以辅助业务方进行决策。
    在这里插入图片描述

二、数据思维

1、数据思维应用场景
在这里插入图片描述
如:构建有效的监控体系和客观的评价标准,用合理的分析方法探究原因以及评价效果,综合运用统计学知识对活动效果进行评估。

2、如何培养数据思维

(1) 熟悉业务及常用的数据分析方法,最好建立自己的分析体系
在这里插入图片描述

  • 对比分析是得出数据结论最简单有效的方法。(单独出一篇说明)
  • 分群思维是贯穿数据分析全链路的分析思维。(单独出一篇说明)
  • 相关性分析师探索变量关系的方法,但是相关性不代表因果性。需要掌握必要的因果推断方法。(单独出一篇说明)

(2)面对具体问题,多问为什么,树立目标意识,找出需求背后的潜在分析点
切忌沦为业务方的“取数工具人”。要多沟通,挖掘数据需求背后的真实用意,主动提出更多数据分析,切实解决业务问题。

(3)建立标准,通过客观的标准代替主观的判断
数据分析师排查业务问题的步骤:
用假设检验,代替预设立场——>与特定标准进行比较——>排查原因——>定位问题。

(4) 基于分析结果,为业务方提出切实可行的解决方案
数据分析师提出合理建议会经历的三个阶段:给数据,给报告,给观点。给观点比较难,不仅需要熟练的分析技巧、缜密的数据思维,还需要对业务有极深的了解。

数据分析师需要避免的几种提建议的方式
在这里插入图片描述

三、数据埋点

在数据产生过程,数据分析师需要关注三个问题:
第一,用户的哪些行为会被采集到,是在客户端还是在服务器被采集到;
第二,实现用户数据采集的技术有哪些以及它们之间的异同;
第三,采集到的用户数据是如何实现上报的。

数据埋点流程:
在这里插入图片描述
埋点设计6步骤:
在这里插入图片描述

四、数据标签体系(典型:用户画像)

用户画像是数据标签体系的一种。用户画像,是把用户的多维度标签按照一定规律进行组合,以提高数据分析师的分析效率,更好地辅助运营人员进行决策。
《用户画像》 传送门

1、数据标签体系的作用
用户洞察、个性推荐、渠道优化、营销增强等。

2、数据标签的分类
从计算方式层面分类,可以分为统计类标签、规则类标签、模型类标签(如机器学习类标签)。
数据分析师负责统计类标签、规则类标签的构建和维护;算法工程师负责模型类标签的维护。
按更新时间分类:离线标签、实时标签。

数据标签可以根据不同的业务需求和业务形态进行层级分类,分类原则遵照MECE原则(相互独立、完全穷尽)

3、数据标签体系构建流程
在这里插入图片描述

五、数据指标体系

xxx

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/371630.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于ORB-SLAM2+RTAB-MAP+ROS的三维重建设计——环境配置与安装

写下这篇是为了毕设题目《基于深度相机的电缆识别系统》。使用的设备与环境如下:Ubuntu 20.04ROSGazebo仿真运行Kinect 2.0ORB-SLAM2论文地址:https://arxiv.org/abs/1610.06475GitHub:https://github.com/raulmur/ORB_SLAM2一、为什么要选择…

python多线程网络编程

背景 使用过flask框架后,我对request这个全局实例非常感兴趣。它在客户端发起请求后会保存着所有的客户端数据,例如用户上传的表单或者文件等。那么在很多客户端发起请求时,服务器是怎么去区分不同的request对象呢?当查看了大量的…

Android 8请求权限时弹窗BUG

弹窗BUG 应用使用requestPermissions申请权限时,系统会弹出一个选择窗口,可进行允许或拒绝, 此窗口中有一个”不再询问“的选择框, ”拒绝”及“允许”的按钮。 遇到一个Bug,单点击“不再询问”,“允许”这个按钮会变…

OpenAPI SDK组件介绍

背景 公司成立以来,积累了数以万计的可复用接口。上层的SaaS业务,原则上要复用这些接口开发自己的业务,为了屏蔽调用接口的复杂性,基础服务开发了apisdk组件,定义了一套声明OpenAPI的注解、注解解析器,实例…

【蓝牙mesh】Bearer层(承载层)介绍

【蓝牙mesh】Bearer层(承载层)介绍 Bearer层简介 蓝牙Mesh协议栈由多个不同的协议层组成,其中最底层的协议就是Bearer层,它负责提供数据传输的底层支持。蓝牙Mesh协议栈的最底层就是BLE协议栈,所以Bearer层是直接与BL…

GO 中的 defer 有哪些注意事项?下

上次一起写了 3 个案例,咱们这一次继续,这一次的会比上一次的稍微不太一样 案例 1 还有一个也非常常用的案例,使用 defer 来捕获异常 ,也就是当程序崩溃的时候,defer 语句可以帮我们兜底,可以捕获异常后按…

vscode 配置 codeql

1、安装配置 codeql 环境 1.1 下载 codeql-cli 和 codeql 标准库 1)下载安装 下载安装 codeql-cli: Releases github/codeql-cli-binaries GitHub 下载 codeql 标准库:https://github.com/gi thub/codeql 下载的安装包解压,codeql 可执…

二,从源代码开始编译安装iperf3

本文目录Linux系统中编译安装基本知识简介第一步,执行configure第二步,执行make第三步,make install其它功能说明Linux系统中编译安装基本知识简介 从前一文章"一,下载iPerf3最新源代码"我们已经知道如何通过git的方式…

Linux系统下命令行安装MySQL5.6+详细步骤

1、因为想在腾讯云的服务器上创建自己的数据库,所以我在这里是通过使用Xshell 7来连接腾讯云的远程服务器; 2、Xshell 7与服务器连接好之后,就可以开始进行数据库的安装了(如果服务器曾经安装过数据库,得将之前安装的…

干货 | 八条“黄金规则”解决RF电路寄生信号

PART 01 接地通孔应位于接地参考层开关处流经所布线路的所有电流都有相等的回流。耦合策略固然很多,不过回流通常流经相邻的接地层或与信号线路并行布置的接地。在参考层继续时,所有耦合都仅限于传输线路,一切都非常正常。不过,如…

MySQL关于NULL值,常见的几个坑

数据库版本MySQL8。 1.count 函数 觉得 NULL值 不算数 ,所以开发中要避免count的时候丢失数据。 如图所示,以下有7条记录,但是count(name)却只有6条。 为什么丢失数据?因为MySQL的count函数觉得 Null值不算数,就是说…

Shader(着色)

1.深度测试(Z-Buffer )每个像素需要一个深度来排序是否需要渲染,所以需要额外的buffer来存储,frame buffer 存颜色,depth buffer (z-buffer) 存深度。2.Lambert(漫反射)3.Blinn-Phong (高光)4.环…

Netty权威指南总结(一)

一、为什么选择Netty:API使用简单,开发门槛低,屏蔽了NIO通信的底层细节。功能强大,预制了很多种编解码功能,支持主流协议。定制能力强,可以通过ChannelHandler对通信框架进行灵活地拓展。性能高、成熟、稳定…

一文搞定Android Vsync原理简析

屏幕渲染原理"现代计算机之父"冯诺依曼提出了计算机的体系结构: 计算机由运算器,存储器,控制器,输入设备和输出设备构成,每部分各司其职,它们之间通过控制信号进行交互。计算机发展到现在,已经出…

【Python知识点桂电版】01基本数据类型

一、变量变量定义注:查看变量类型->type(变量)查看变量地址->id(变量)变量命名规则只允许出现:英文、中文、数字、下划线(不推荐用中文,不能以数字开头)大小写敏感不可使用关键字(如and)和…

代码随想录【Day24】| 开始回溯!77. 组合

回溯的本质是穷举,穷举所有可能,然后选出我们想要的答案,如果想让回溯法高效一些,可以加一些剪枝的操作,但也改不了回溯法就是穷举的本质。 那么既然回溯法并不高效为什么还要用它呢? 因为没得选&#xf…

cesium: 设置skybox透明并添加背景图 ( 003 )

第003个 点击查看专栏目录 本示例的目的是介绍如何在vue+cesium中设置skybox透明并添加背景图。 我们不想要黑乎乎的背景,想自定义一个背景图,然后前面显示地球。 直接复制下面的 vue+cesium源代码,操作2分钟即可运行实现效果. 文章目录 示例效果配置方式示例源代码(共70…

奇妙的background-clip:text

我们在学习CSS3时,一个背景属性background-clip用来对背景进行裁剪,即指定背景绘制的区域,通常我们使用的几个属性如下:值说明border-box默认值。背景绘制在边框方框内(剪切成边框方框)。padding-box背景绘…

【C++入门(上篇)】C++入门学习

前言: 在之前的学习中,我们已经对初阶数据结构进行相应了学习,加上之前C语言的学习功底。今天,我们将会踏上更高一级“台阶”的学习-----即C的学习!!! 文章目录1.C 简介1.1什么是C1.2.C的发展史…

【数据库】join SQL语句原理优化

背景 在实际的开发中,业务相关表都是通过uid或者一个可以标记业务领域的一个属性转换成的字段进行关联的,但是对于一些后续的业务,比如数据分析、下游系统使用、金融对账等业务,需要进行多表联查,之前实际生产的时候就…