数据分析入门

news2024/11/19 6:43:32

B站:01第一课 数据分析岗位职责和数据分析师_哔哩哔哩_bilibili

一、岗位:数据分析师

Q1 数据分析师在公司做什么工作? 

数据来源于公司核心业务,通过监测业务健康度来确定业务的健康状况;

通过对用户精细化分析,找出增长点,强化核心业务或开拓新业务。 

Q2 数据分析师使用什么工具?

使用sql对接数据源,excel对接业务人员。python在生产力方面与同行拉开差距。

Q3 数据分析师需要具备什么技术能力?

1.业务能力。在熟知业务的基础上,设计更加有价值的监测指标与用户埋点,获取更有价值的数据,为后续分析打下基础。

2.Excel、Sql、Python等分析软件。主要用于已获取数据的自动整合、监测、分发等,用来减轻人工的工作量。

3.统计学、数据分析报告、业务能力等。分析客观数据,得出分析结论。

4.BI平台。在该平台中完成上述工作,需要掌握平台的使用方法。

5.机器学习、搭建指标体系等相关知识。用于支撑核心业务增长或开拓新业务线。

6.行业报告分析。用于行业、数据探索。 

业务可以通过积极参与业务会议等方式掌握。和运营相比,掌握业务全局。

sql等工具通过系统学习和使用掌握。和表哥表姐相比,对业务有更深的掌握,通过数据分析总结。

数据分析通过系统的学习掌握。是数据分析师结果产出物,直接效益的体现。

python通过系统的学习掌握,用于加强自身竞争力,成为领域专家。

Q4 如何进行学习规划?

 

列出所需的技术栈,根据市场需求与自身特点(对自身是优势)分出优先级。

Q5 到达新公司后,如何迅速了解业务?

1.获得公司架构图。从中了解部门怎么设置,业务怎么开展。从用户到下订单的整个业务流程中,各部门如何参与,负责哪些业务。重点看运营架构、产品架构。

2.获取业务数据表。作为用户使用。获得主表、用户行为。

二、如何获得数据:指标体系与用户路径

Q1 指标可以用来干什么?

建立指标体系目的是获得全面而充足数据支撑,通过分析,从而发现问题、或得出主观问题的结论。 

优秀的指标体系在制定每个指标时,会与业务目标密切关联,紧密围绕活动策略,数据结果可以有效的衡量产品的健康程度与策略是否有效。  

 

Q2 指标包含什么构成要素?

Q3 面对混乱的指标数据时,如何将其定量比较?

指标之间因为计数单位、数据量、计算方式等量纲的不同,导致无法直接进行比较。

基于此问题,通常采用归一化标准化两种方法来去除量纲。 

  • 归一化:通过对同一组的统计量做统计,使该组数值在0-1之间变化。公式:(当前值-最小值)/(最大值-最小值)。归一化后,不同组数据即可做出比较。
  • 标准化:在计算一组数据的方差后,通过开根号的方式去除该组数据的量纲。 

Q4 如何拆分指标?  

1.在宏观上,从指标本身类型和获得复杂度来说,包括基础指标、复合指标和派生指标。

2.当聚焦在产品的不同生命周期阶段时,会产生各阶段的重点关注指标。

3.当细化到每个具体的业务时,从业务工作的拆分来讲,可根据业务的不同分为不同的指标类。 

4.对于互联网产品来说,会特别关注以下指标。 

5.从用户行为的角度来看,通过用户在关键路径上的一系列行为,为每个行为拆分测量指标。

Q5 如何分析用户路径?

视频类用户路径

电商购物用户路径 

内容平台用户路径

三、指标数据的分析 

Q1 获得指标数据后,可以分析什么信息? 

1.分析不同类型业务在整个业务中的占比情况

2.分析业务的增长趋势 

3.通过与自己、他人进行比较,分析业务的增长率和竞争力  

4.通过画象限的方法,分析出强势和弱势的业务  

5.通过对头部流量的分析,分析流量投入的集中程度 

6.通过对地域、用户、业务的维度分析,分析不同维度的用户对业务的偏好。  

TGI指数:在某个活动中,目标群体在总人群中的占比

——地域维度

——用户维度

——业务维度

06 复杂指标数据的影响因素有什么

指标的影响因素包括产品本身素质和用户群体两方面影响。

产品本身素质包括用户流量、转化率、成功率、价格等多项产品因素组成;用户群体为目标群体的群体特性。

用户群体作为对最为影响产品成功的部分,对受众群体做出细分,并进行完善的用户画像来研究。


四、分析的进行:统计

Q1 如何判断数据是否稳定?

描述统计学用于研究单个变量的集中趋势与离散趋势。 


选择一个数值来作为中心

Q2 确定中心数时,如何保证数据的代表性?



方差=[(数值1-平均数)²+(数值2-平均值)²+…]/N 

用来直观的对比离散程度的高低

标准差²=方差。去除方差的量纲,更精准的提现离散趋势

极差=(最大-最小) 。提现数据的偏差程度

偏差、方差共同描述离散程度。

Q3 如何判断数据范围?



Q4 如何找到异常值?

当数据服从正态分布,使用3σ原则

当数据不服从正态分布,使用箱线图


1.从小到大排列已有数据

2.选取25%,50%,75%,100%位距的数值

3.计算四分位距IQR,从而获得箱线图中箱子的长度;箱线图为数据提供3倍IQR的容错量。

IQR=Q3-Q1;上界=Q3+1.5IQR;下界=Q3-1.5IQR

4.根据数值画出箱线图,极限外的数据排除为异常数据

Q5 根据当前数据,如何预测接下来的趋势?

五、分析结果的运用

Q1 如何获得问题的结果?



1.罗列关联的数据(不同分析角度寻找不同数据)

2.列出公式,计算单位供给能力

3.列出公式,计算需求量

4.计算供给量


Q2 如何进行事件的策划?

人、时、地、事、因、做、果

把项目实际落地的具体手段。

策划产品活动案例

思考的基础是信息。若缺少信息,通过提问获得基础数据和细节。如:定价、产品价值、用户画像等。



分析付费点案例

拆分维度案例


Q3 如何分析用户的增长和留存?

常规模型:分析用户增长和留存的模型AARRR


拼多多模式:RARRA模型

留存——激活——传播——变现——注册

游戏化思路


游戏化用户增长策略:八角模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1112592.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一站式智慧校园解决方案 SaaS云平台智慧校园管理系统源码

SaaS云平台 智慧校园管理平台 教师端、家长端、学生端 智慧校园以互联网为基础,以“大数据云服务”为核心,融合校园教学、管理、生活软硬件平台,定义智慧校园新生活。智慧校园管理平台管理者、教师、学生、家长提供一站式智慧校园解决方案&a…

Zynq中断与AMP~双核串口环回之PS与PL通信

实现思路: 额外配置:通过PL配置计数器,向CPU0和CPU1发送硬中断。 1.串口中断CPU0,在中断中设置接收设置好字长的数据,如果这些数据的数值符合约定的命令,则关闭硬中断,并将这部分数据存入AxiLi…

SystemVerilog Assertions应用指南 Chapter1.29“ disable iff构造

在某些设计情况中,如果一些条件为真,则我们不想执行检验。换句话说,这就像是一个异步的复位,使得检验在当前时刻不工作。SVA提供了关键词“ disable iff来实现这种检验器的异步复位。“ disable iff”的基本语法如下。 disable iff (expression) <property definition> …

SystemVerilog Assertions应用指南 Chapter1.31 在属性中使用形参

可以用定义形参( formal arguments)的方式来重用一些常用的属性。属性“arb”使用了4个形参,并且根据这些形参进行检验。其中还定义了特定的时钟。SVA允许使用属性的形参来定义时钟。这样,属性可以应用在使用不同时钟的相似设计模块中。同样的,时序延迟也可以参数化,这使得属性…

微信小程序开发之自定义组件(会议OA项目其他页面搭建)

目录 前言 一、WeChat中的自定义组件 1. 基本概述 2. 包含文件及作用 3. 自定义组件的作用 4.使用步骤&#xff1a; 二、tabs组件及会议管理布局 tabs组件 1. 创建组件 准备 创建 使用组件 会议管理布局 tabs.wxml指定组件模版 tabs.wxss完成样式设计 tabs.js定义属…

Ubuntu docker安装mysql

本文介绍如何在docker中安装mysql&#xff0c;之前有尝试过先在docker中安装一个ubuntu到镜像&#xff0c;然后进去再去安装mysql相关的东西&#xff0c;发现不行&#xff0c;这边整理一下一个可行的方式。 在下载镜像的时候&#xff0c;直接下载mysql镜像。 1.搜索镜像 doc…

【C++】类和对象(初阶认识)#下篇#

目录 初始化列表 匿名 explicit、隐式类型转换、连续构造的优化 友元 类中的静态变量 类中类 话接上回 运算符重载 内置类型是祖师爷定义的&#xff0c;赋值、或 加减乘除 祖师爷自己知道这些运算符应该进行怎么样的操作&#xff0c;平常给我们直接用就好&#xff1b;但是自定义…

力扣刷题 day49:10-19

1.二进制手表 二进制手表顶部有 4 个 LED 代表 小时&#xff08;0-11&#xff09;&#xff0c;底部的 6 个 LED 代表 分钟&#xff08;0-59&#xff09;。每个 LED 代表一个 0 或 1&#xff0c;最低位在右侧。 例如&#xff0c;下面的二进制手表读取 "4:51" 。 给你…

根据SpringBoot Guides完成进行示例学习(详细步骤)

目录 1.打开Spring | Guides官网&#xff0c;或者直接搜索springboot都可 2.选择要学习的内容 3.根据提示的网址&#xff0c;Git到本地 4.将文件用IDEA打开&#xff0c;根据教程完成示例&#xff0c;这里不做细致讲解 5.运行项目 6.在终端查看运行结果 以Scheduling Task…

蓝桥每日一题(day2 暴力)扫雷 easy

ac代码&#xff1a; #include <iostream> using namespace std; const int N 110;int n, m; int arr[N][N]; int dx[8] {0, 1, 0, -1, -1, 1, -1, 1}; int dy[8] {1, 0, -1, 0, -1, 1, 1, -1}; int main() {cin >> n >> m;for(int i 0; i < n; i )fo…

ESP32出现喂狗失败处理办法

前言 &#xff08;1&#xff09;今天在使用ESP32S3的时候&#xff0c;做移植测试的时候&#xff0c;不知道为什么出现了看门狗报错。简单查了一下&#xff0c;测试发现是任务阻塞导致的。 报错 &#xff08;1&#xff09;报错信息如下&#xff1a; <1>E (5368) task_wdt:…

tcp专题

目录 一.TCP的连接建立 1.1面向连接 1.2TCP报文结构 1.3TCP三次握手 1.4TCP的状态变化 1.5为什么必须是三次握手&#xff0c;而不是两次或者四次 二.TCP的连接断开 2.1TCP的"四次挥手 2.2TCP的状态变化 2.3为什么要有TIME_WAIT状态 2.4为什么TIME_WAIT状态的时…

[Hive] explode

在 Hive 中&#xff0c;explode 函数用于将数组&#xff08;Array&#xff09;或者Map类型的列拆分成多行&#xff0c; 每个元素或键值对为一行。这允许我们在查询中对数组或 Map 进行扁平化操作。 下面是使用 explode 函数的示例&#xff1a; 假设我们有一个包含数组字段的表…

【牛客网】另类加法

题目 思路 考虑使用位运算进行解决两个数异或的结果是两个数相加不考虑进位的结果(不考虑进位) 两个数与左移一位的结果,是两个数相加之后进位的结果(只考虑进位)结论:两个数相加,如果不需要进位,即与左移等于0,则这个给值就是两个数相加 的值 代码 import java.util.*;publ…

npm 执行命令时报错npm ERR! code ERESOLVE npm ERR! ERESOLVE could not resolve

npm ERR! code ERESOLVE npm ERR! ERESOLVE could not resolve npm ERR! npm ERR! While resolving: vue-office/docx1.3.0 npm ERR! Found: vue-demi0.14.6 npm ERR! node_modules/vue-demi npm ERR! vue-demi“^0.14.6” from the root project npm ERR! vue-demi“*” from …

C++初阶--C++入门(2)

C入门&#xff08;1&#xff09;链接入口 文章目录 内联函数auto关键字注意事项 基于范围的for循环(C11)nullptr 内联函数 以inline修饰的函数叫做内联函数&#xff0c;编译时C编译器会在调用内联函数的地方展开&#xff0c;没有函数调用建立栈帧的开销&#xff0c;内联函数提…

运筹优化 | 分支定界算法(Branch and Bound)Python求解整数规划

from gurobipy import * import copy import numpy as np import matplotlib.pyplot as plt plt.rcParams[font.sans-serif][SimHei]定义了一个线性松弛问题&#xff0c;并用Gurobi求解 initial_LP Model(initial LP) # 定义变量initial_LP&#xff0c;调用Gurobi的Model&…

运机转债上市价格预测

运机转债-127092 基本信息 转债名称&#xff1a;运机转债&#xff0c;评级&#xff1a;AA-&#xff0c;发行规模&#xff1a;7.3亿元。 正股名称&#xff1a;运机集团&#xff0c;今日收盘价&#xff1a;16.2元&#xff0c;转股价格&#xff1a;17.67元。 当前转股价值 转债面…

【AIGC核心技术剖析】基于大规模弱监督的鲁棒语音识别【附源码】

论文研究了语音处理系统的能力&#xff0c;该系统只是为了预测互联网上的大量音频成绩单而训练的。当扩展到 680,000 小时的多语言和多任务监督时&#xff0c;生成的模型可以很好地推广到标准基准&#xff0c;并且通常与先前的完全监督结果竞争&#xff0c;但在零镜头传输设置中…

【ArcGIS绘图系列1】在ArcGIS中制作柱状图与饼状图

成图展示 图形出处&#xff1a;J2023-Assessment of agricultural drought based on multi-source remote sensing data in a major grain producing area of Northwest China 实现步骤 第一步 查看数据信息 数据输入到ArcGIS中&#xff1a;包含数据表和shp文件 1、shp文件…