[数据分析] 数据指标体系搭建

news2024/11/26 22:43:40

在数据分析的学习过程中,我们通常会要求掌握以下两点:

1.理解数据,懂得从数据中发现业务指标(学会如何去看懂数据)

2.使用相关指标去分析数据,同时使用多个指标去分析一个问题(了解常见的指标)


当我们拿到数据(通常以Excel或者数据库方式去呈现数据),那么我们如何去理解数据?

1.理解数据

(1) 弄清楚数据每一栏位表示的是什么意思

(2) 对数据进行分类(有助于后期的分析)

通常将数据分为三类:

1.用户数据:用户的基本信息,包括姓名、性别、邮箱、年龄、家庭地址、职业、教育水平等

2.行为数据:记录用户做过什么的数据,其主要包括用户做了哪些行为、发生行为的时间等

例如:逛电商购物平台,用户行为可以是用户在某个产品页面的停留时间、浏览过哪些产品、购买了哪些产品等

3.产品数据:包括产品名称、产品类别、产品评论、库存等

一个平台里的东西都可以看作产品,例如优酷上的视频,CSDN里面的文章,淘宝里面的商品都可以看作产品 

例如:把CSDN发过的文章看作产品,这样“产品数据”就包括文章标题、文章阅读量、发布文章的日期等

对于数据的分类并不是绝对的,要根据具体业务去灵活定义

有些数据从不同角度来看,可以属于不同的分类。例如,对于B站视频的收藏量而言,收藏是一个用户的行为,那么收藏量可以看作是行为数据;另外,收藏是产品(视频)被收藏,那么收藏量也可以看作是产品数据

2.构建指标体系

聚焦某一个业务问题或者场景进行数据分析时,首先需要构建合理的指标体系或者模型,从而能够有效“整理”来自不同数据源的各场景所汇聚的大量数据

2.1 什么是指标?

指标是指将业务单元精分后量化的度量值,能够使得业务目标可描述、可度量、可拆解;另一种说法:用某个统一标准去衡量业务,这个统一的标准就是指标

2.1.1 用户数据指标

① 日新增用户数:产品每天新增的用户是多少

提示Tips:按渠道维度来拆解新增用户,可以看出不同渠道分别新增了多少用户,从而判断出渠道推广的效果

② 活跃用户数按时间可分为日活跃用户数、周活跃用户数以及月活跃用户数

日活跃用户数:一天之内活跃的用户数

周活跃用户数:一周之内至少活跃一次的用户总数

月活跃用户数:一个月之内至少活跃一次的用户总数

提示Tips:统计活跃用户数需要去除重复的数据,例如小明每天都登录CSDN博客网站,每天活跃1次,1个月活跃30次,月活跃人数不是30而是1,不管1个人1个月活跃多少次,月活跃人数是1

③ 活跃率是活跃用户在总用户中的占比,根据时间可分为日活跃率、周活跃率以及月活跃率

④ 留存率:第1天新增的用户中,在第N天还在使用产品的用户数除以第一天新增总用户数,如果按时间划分,留存率可分为次日留存率、第3日留存率、第7日留存率以及第30日留存率

举个栗子,某产品第1天新增用户100个,第2天这100个人里面有40个人还在使用该产品,那么次日留存率 = 40 / 100 = 40% ;如果第7天这100个人里面有20个人还在使用该产品,那么第7日留存率 = 20 / 100 = 20%

次日留存率:第1天新增的用户中,在第2天使用过产品的用户数 / 第1天新增总用户数

第3日留存率:第1天新增的用户中,在第3天使用过产品的用户数 / 第1天新增总用户数

第7日留存率:第1天新增的用户中,在第7天使用过产品的用户数 / 第1天新增总用户数

第30日留存率:第1天新增的用户中,在第30天使用过产品的用户数 / 第1天新增总用户数

提示Tips:留存可以评估产品功能对用户的黏性,反映用户留存的指标,我们可以使用留存率来表示

通过渠道推广过来的新用户,经过一段时间可能会有一部分用户逐渐流水,这类用户被称为流失用户,留下来的用户称为留存用户

2.1.2 行为数据指标

① PV(Page View):访问次数,一定时间内某个页面的浏览次数

某一个网页1天中被打开10次,那么PV就是10,可理解为用户每打开一个网页可以看做一个PV

② UV(Unique Visitor):访问人数,一定时间内访问某个页面的人数

某一个网页1天中被1个人打开过10次,那么UV是1而不是10 

提示Tips:通过比较PV或者UV的大小,可以看到用户喜欢产品的哪个功能,不喜欢哪个功能,从而根据用户行为来优化产品

③ 转发率:转发某功能的用户数 / 看到该功能的用户数

④ 转化率:在一个统计周期内,完成转化行为的次数占推广信息总点击次数的比率

提示Tips:转化率的计算方法与具体业务场景有关

举例说明

店铺转化率 = 购买产品的人数 / 到店铺的人数

广告转化率 = 点击广告的人数 / 看到广告的人数

2.1.3 产品数据指标

① GMV(Gross Merchandise Volume):成交总额,包括销售额、取消订单金额、拒收订单金额和退货订单金额

一个电商企业的月销售额为20w元,未支付订单金额2w元,拒收订单金额0.5w元,退货订单1w元,那么该电商的GMV = 20w + 2w + 0.5w + 1w = 23.5w

提示Tips:只要拍下的订单,就会被计入到GMV中,不管取消不取消订单、拒不拒收货物、退不退货

② 成交数量:下单的产品数量

③ 访问时长:用户使用App或者网站的总时长

④ ARPU(Average Revenue Per User):人均付费,也称为客单价

人均付费 = 总收入 / 总用户数

⑤ ARPPU(Average Revenue Per Paying User):付费用户人均付费

付费用户人均付费 = 总收入 / 付费人数

⑥ 人均访问时长:统计每个人使用产品的平均时长 

人均访问时长 = 总时长 / 总用户数

⑦ 付费率:反映产品的变现能力和用户质量

付费率 = (付费人数 / 总用户数) x 100%

某App产品有100万注册用户,其中有10万用户有在该App进行过消费,那么该产品的付费率 = (100000 / 1000000) x 100% = 10%

⑧ 复购率:重复购买频率,指一定时间内,消费两次以上的用户数/付费人数,用于反映用户的付费频率

复购率 = 消费两次以上的人数 / 付费人数

⑨ 产品相关:根据具体的业务需求,灵活扩展使用产品相关指标

例如:热销产品Top N、好评产品Top N、差评产品Top N


注意:除了上述介绍的指标以外,还有其他指标并没有进行讲解,我们也可以按行业(制造业、金融、互联网电商等)以及按业务(推广效果等)不同的维度进行指标选取和设定,读者可自行去查阅检索 

2.2 指标类型

(1) 原子指标

原子指标 = 行为事件 + 度量

可理解为某一业务行为事件下的度量,是业务定义中不可拆分的指标,如点击量

原子指标还会基于维度、修饰词、统计口径构建出派生指标

(2) 派生指标

派生指标 = 一个原子指标 + 多个修饰词 + 时间周期 

例如:

原子指标 = 点击量

派生指标 = 近一周ios注册用户点击量

近一周ios注册用户点击量 

时间周期:近一周    修饰词:ios    维度:注册用户    原子指标:点击量 

2.3 如何选择指标?

这么多指标,如何选择呢?选择指标的时候,需要考虑两点

1.好的数据指标应该是比例

通常要想理解一个数字的真实含义,最好把它除以一个总数,换算成一个比例。

例如:告诉你公众号打开次日文章用户数(活跃用户数)是1万,让你分析公众号是否有问题。这其实是看不出来的,如果告诉你总粉丝数有10万,那么可以计算出次日活跃率 = 1万(活跃用户数) / 10万(总用户数) = 10%,与行业平均活跃率(公众号的平均活跃率是5%)相比较而言,会发现该公众号活跃率很高

所以,在求职面试或者工作里看到指标的时候,要看这个指标是不是个比例,如果不是,需要换算成比例

2.根据目前的业务重点,找到核心指标

核心指标没有唯一标准。不同的公司关注的业务重点不一样,即使是同一家公司在不同的发展阶段,业务重点也不一样,所以要根据目前的业务重点,去寻找核心指标

案例核心指标
Instagram照片分享率
facebook月活跃用户率
喜马拉雅用户收听时长

注:用户收听时长,就是每一个用户进来以后,他能听多久的音频(喜马拉雅是音频APP)

2.4 什么是指标体系?

在统计研究中,如果要说明总体全貌,只使用一个指标往往只能反映总体某一方面的数量特征。此时,就需要同时使用多个相关指标,而这多个相关又相互独立的指标所构成的统一整体,即为指标体系(指标体系是从不同维度梳理业务,把指标有系统的组织起来)

将指标体系化本质是将数据指标系统性的组织起来

简而言之,指标体系 = 指标 + 体系,一个指标不能叫指标体系,几个毫无关系的指标也不能叫指标体系,如果只有指标而没有体系,我们能够获取的信息就会变得很乱(指标体系不是指标的罗列)

建立指标体系的目的在于获取全局性的、有体系的信息,进而通过这些信息去驱动业务的发展,达成组织目标

指标体系的作用

1.监控业务情况

2.通过拆解指标寻找当前业务问题

3.评估业务可改进的地方,找出下一步工作的方向

对于一家公司的业务是否正常(健康),可以通过指标体系对业务进行监控。当业务出现异常时,就能以最快的速度发现问题,开始分析,然后解决这些问题,最大化地减少损失。

缺少数据指标体系规划,容易出现的问题:

1.问题定位难

2.数据采集工作反复进行

3.上下目标不一致

4.监控、分析阶段效率低

分析具体业务问题时,找数据会变得越来越难,每天会消耗大量时间在不断寻找数据、核对指标的泥潭中,因此构建数据指标体系极为重要


好的指标体系是随着实践的深入和认识的提高,逐渐生长出来的,而非起初就完美设计出来

2.5 如何建立指标体系?

每个指标可以从以下3个方面确定统计口径

① 指标业务含义:这个指标在业务上表示什么?

② 指标定义:这个指标是怎么定义的?

③ 数据来源:从什么地方收集的原始数据?数据统计的时间范围是什么? 

1.明确部门KPI,设定一级指标

一级指标是用于衡量公司或部门运营整体目标达成的情况以及战略目标的结果

一级指标并非只能是一个指标,有可能需要多个指标来综合评价

2.了解业务运营情况,设定二级指标

针对一级指标进行分析拆解,高效定位一级指标波动的原因,具体如何拆解,需要了解业务是如何运营的

3.梳理业务流程,设定三级指标

定位二级指标变动的原因,把二级指标按照业务流程拆解为更细的三级指标,指导一线部门的决策

4.通过报表监控指标,不断更新指标体系

通过前面三个步骤找到一级指标、二级指标以及三级指标,使用表格、图表来展示指标,通过报表监控指标,方便业务部门掌握业务情况的同时,也能够实时更新指标体系

制作报表步骤

(1) 需求分析

制作报表的目的是什么?

(2) 建立指标体系

(3) 设计展现形式

如何展示数据,才能让业务部门更容易地理解数据?

(4) 编写需求文档

说明报表原型,更新频率等信息

(5) 报表开发

和开发沟通排期,跟进开发进度,验证报表的数据质量

补充扩展知识:建立指标体系需要注意以下4点

① 抓住问题重点,需要设置准确的一级指标

② 指标之间需要有逻辑关系

如果不按照业务流程来建立指标体系,虽然指标很多,但是指标之间没有逻辑关系,以至于出现问题的时候,找不到对应的业务节点是哪个,没有办法解决实际问题

③ 拆解的指标需要有业务意义,不能只为了拆解而拆解

④ 建立指标体系需要各部门紧密沟通,需要对公司业务和各部门职能有深刻的理解

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/336193.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

机器学习评估指标的十个常见面试问题

评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些模型、如何改进现有模型以及如何优化给定任务的性能做出正确的决定,所…

java世界String的那些事

String的创建机理: 由于String在Java世界中使用过于频繁,Java为了避免在一个系统中产生大量的String对象,引入了字符串常量池。其运行机制是:创建一个字符串时,首先检查池中是否有值相同的字符串对象,如果…

【Nacos】Nacos配置中心客户端配置更新源码分析

上文我们说了服务启动的时候从远程Nacos服务端拉取配置,这节我们来说下Nacos服务端配置的变动怎么实时通知到客户端,首先需要注册监听器。 注册监听器 NacosContextRefresher类会监听应用启动发布的ApplicationReadyEvent事件,然后进行配置…

现在00后也这么卷?部门刚来的00后软件测试工程师已经要把我卷崩溃了...

都说00后躺平了,但是有一说一,该卷的还是卷。这不,刚开年我们公司来了个00后,工作没两年,跳槽到我们公司起薪18K,都快接近我了。后来才知道人家是个卷王,从早干到晚就差搬张床到工位睡觉了。 最…

sqlmap对http请求头扫描,爬取数据库数据

做安全测试时,先用appscan扫描目标网站,爆出sql盲注的风险 然后使用sqlmap专业工具来扫描分析漏洞 GitHub - sqlmapproject/sqlmap: Automatic SQL injection and database takeover toolAutomatic SQL injection and database takeover tool - GitHub …

Mysql 部署 MGR 集群

0. 参考文章 官方文档: MySQL :: MySQL 8.0 Reference Manual :: 18.2 Getting Started 博客: MGR 单主模式部署教程(基于 MySQL 8.0.28) - 墨天轮 (modb.pro) mysql MGR单主模式的搭建 - 墨天轮 (modb.pro) MySQL 5.7 基于…

Vue2之完整基础介绍和指令与过滤器

Vue2之基础介绍和指令与过滤器一、简介1、概念2、vue的两个特性2.1 数据驱动视图2.2 双向数据绑定3、MVVM二、vue基础用法1、导入vue.js的script脚本文件2、在页面中声明一个将要被vue所控制的DOM区域3、创建vm实例对象(vue实例对象)4、样例完整代码三、…

Oracle Dataguard(主库为 Oracle rac 集群)配置教程(02)—— Oracle RAC 主库的相关操作

Oracle Dataguard(主库为 Oracle rac 集群)配置教程(02)—— Oracle RAC 主库的相关操作 / 本专栏详细讲解 Oracle Dataguard(Oracle 版本为11g,主库为双节点 Oracle rac 集群)的配置过程。主要…

数据库 与 数据仓库的本质区别是什么?

当用计算机来处理数据的时候, 数据就需要存储和管理了。早期的数据, 就是用一个文件来实现的, 即是文件系统。随着处理的数据量增大, 发展到用数据库来管理和存储数据了。 数据库包括多媒体数据库、对象关系数据库和关系数据库。关系数据库管理系统,已经成为了事实上通用的数据…

FANUC机器人UI[4]_CSTOPI循环停止信号使用时的注意事项

FANUC机器人UI[4]_CSTOPI循环停止信号使用时的注意事项 前面已经和大家介绍了关于FANUC机器人的UOP信号的具体功能,具体可参考以下链接中的内容: FANUC机器人UOP信号(UI+UO)功能详细介绍 本次关于FANUC机器人的UI[4] CSTOPI循环停止信号使用时的注意事项进行一个补充说明。…

C语言-程序环境和预处理(14.2)

目录 预处理详解 1.预定义符号 2. #define 2.1 #define定义标识符 2.2 #define 定义宏 2.3 #define 替换规则 注意事项: 2.4 #和## 2.5 带副作用的宏参数 2.6 宏和函数对比 3. #undef 4. 条件编译 4.1 单分支条件编译 4.2 多分支条件编译 4.3 判断是…

基础篇:01-微服务概述

1.单体应用与微服务架构区别 如上图左侧为单体应用架构。在传统单体应用中,所有功能模块都在一个工程中编码、部署,即使是集群部署,也只是单体应用的水平复制。 如上图右侧为微服务架构。在微服务架构的项目中,每个应用会按照领域…

浅谈保护数据的加密策略

加密是一种将信息从可读格式转换为混乱字符串的技术。这样做可以防止数据传输中的机密数据泄露。文档、文件、消息和所有其他形式的网络通信都可以加密。加密策略和身份验证服务的结合,还能保障企业机密信息只对授权用户开启访问权限。常见的数据加密包括以下两种&a…

定期备份日志并发送至存储服务器指定路径脚本

根据需求编写一个日志定时备份并发送至存储服务器的脚本定期把三天前的日志文件备份,打包发送至日志备份服务器指定目录(修改对应路径拿走即用)vim qingli.sh#!/bin/bash#定义星期几week$(date |awk NR1{print $4})num${week}#日志源目录log&…

Android MVI框架搭建与使用

MVI框架搭建与使用前言正文一、创建项目① 配置AndroidManifest.xml② 配置app的build.gradle二、网络请求① 生成数据类② 接口类③ 网络请求工具类三、意图与状态① 创建意图② 创建状态四、ViewModel① 创建存储库② 创建ViewModel③ 创建ViewModel工厂五、UI① 列表适配器②…

【3D目标检测】基于伪雷达点云的单目3D目标检测方法研宄

目录概述细节基准模型点云置信度生成网络特征聚合 DGCNN概述 本文是基于单目图像的3D目标检测方法,是西安电子科技大学的郭鑫宇学长的硕士学位论文。 【2021】【单目图像的3D目标检测方法】 细节 基准模型 作者还是按照伪雷达点云算法的流程设计的,并…

多传感器融合定位十四-基于图优化的定位方法

多传感器融合定位十四-基于图优化的定位方法1. 基于图优化的定位简介1.1 核心思路1.2 定位流程2. 边缘化原理及应用2.1 边缘化原理2.2 从滤波角度理解边缘化3. 基于kitti的实现原理3.1 基于地图定位的滑动窗口模型3.2 边缘化过程4. lio-mapping 介绍4.1 核心思想4.2 具体流程4.…

lamada表达式、stream、collect整理

lamada表达式格式 格式:( parameter-list ) -> { expression-or-statements } 实例:简化匿名内部类的写法 原本写法: public class LamadaTest { public static void main(String[] args) { new Thread(new Runnable() { …

基于PYTHON django四川旅游景点推荐系统

摘 要基于四川旅游景点推荐系统的设计与实现是一个专为四川旅游景点为用户打造的旅游网站。该课题基于网站比较流行的Python 语言系统架构,B/S三层结构模式,通过Maven项目管理工具进行Jar包版本的控制。本系统用户可以发布个人游记,查看景点使用户达到良…

树莓派安装虚拟键盘matchbox-keyboard,解决虚拟键盘乱码问题,解决MIPI DSI触摸屏触控漂移问题

安装虚拟键盘,解决乱码问题 当我们买了触摸屏后,会发现没有键盘,还是无法输入,因此需要虚拟键盘 如果你的语言和地区是中文,那么安装虚拟键盘后可能显示乱码,所以还需要安装中文字体 sudo apt install ttf…