指标与标签的区别?

news2024/11/15 9:32:25

概述

在公司数据建设过程中,经常会使用和提到指标和标签,但是很多小伙伴对于两者的区别确不能讲清楚。实际上标签与指标一样,是理解数据的两种方式,在赋能业务上,两者同样重要。接下来将结合自身的理解,从定义、应用场景、分类等多个方面进行总结。

定义

指标在定义上,主要是对数据的度量,而标签则主要是人为的对数据进行概括性描述。

指标分类

指标的定义

现代管理学之父彼得·德鲁克提出用管理促进企业增长,他讲过一句非常经典的话:“如果你不能衡量,那么你就不能有效增长。”

那么如何去衡量呢?

基于统一的标准去衡量业务,这个统一的标准就是指标,将业务通过可量化、可拆解的形式进行描述,通常是数值型数据。

例如:以淘宝网为例,GMV销售额这个指标就是用来衡量交易金额

标签的定义

基于原始数据进行语义化加工,人为的对业务含义进行概括性描述,标签在数据结构中包含:标签名称及其值。标签往往具备高度概括、相互独立及可枚举的特点。通常在画像应用场景中出现,很形象的描述就是给用户打标签。

举例

借用一个例子如:对小白进行打标,说他是个“大胖子”,就同时概括了身高172cm和体重150斤,而“长得跟李逵似的”,更是把五官、身材、气质等特征都概括进来了。
指标:身高172cm,体重150斤
标签:大胖子

标签与指标的应用场景

对于指标的应用场景,常见的就是公司运营,如报表,主要用来做监测分析,是以业务为导向的。

对于标签的应用场景,更多的是画像应用,通过对实体(用户、商品、帖子、设备等)的标注、刻画、特征提取和分类来划分群体,以应用场景为导向的,跟随业务需求变动。

通常在实际使用中,标签数据的一部分来源就是基于指标进行加工产生的,也可以理解成标签数据是指标的业务化、语义化。

例如:

指标:用户最近30天活跃次数,来打标流失用户这个标签
指标:用户最近7天消费次数及金额,来打标高价值用户

所以,标签体系的建设是非常重要的,不但能丰富数据分析的素材,更能直接推动分析成果落地。

标签与指标的分类

指标的分类

指标的分类主要有加工逻辑分类、业务分类(主题域)、层级等几种,实际使用中常常也联合起来进行分类。

加工逻辑分类

原子指标
用于统计业务活动中某一业务状况的数值,主要是用于明确业务的统计口径和计算逻辑。
例如,用户充值,原子指标为充值金额。

派生指标:由原子指标、修饰词、时间周期三大要素构成,用于统计目标指标在具体时间、维度、业务条件下的数值表现,反映某一业务活动的业务状况。例如,统计最近一天_用户的充值金额

衍生指标:基于原子指标组合构建的,例如,arpu人均充值金额 = 充值金额 / 充值用户数

业务分类

一般是对某一类业务的抽象组合,在数仓可以理解成主题域或业务域。

例如:充值、消费等归类于交易域,例如发帖、评论等归于社交域。

标签的分类

标签的分类主要有加工逻辑分类、重要程度等几种,实际使用中常常也联合起来进行分类。

基于加工方式的标签分类

基础(统计类)标签

是最为基础和常见的标签,例如:性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数、历史累计充值金额、ltv1等

规则类标签

该类标签基于用户行为及确定的规则产生。例如,对应用内“高价值用户”这一口径的定义为“历史累计消费金额≥1万元”。

算法标签

标签通过算法的机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的行为习惯判断该用户是男性还是女性、根据一个用户的社交习惯判断其对某帖子及主播的偏好程度。该类标签需要通过算法挖掘产生。

在项目工程实践中,一般统计类和规则类的标签即可以满足应用需求,在开发中占有较大比例。机器学习挖掘类标签多用于预测场景,如判断用户性别、用户购买商品偏好、用户流失意向等。一般地,算法的机器学习标签开发周期较长,开发成本较高,因此其开发所占比例较小。

总结

上面就是对指标和标签的一些理解,简言之指标更客观,注重事实,而标签则是对数据的描述,标签也是同样重要的。因为除了精准以外,标签数据业务化,更接近于日常,更易理解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/61648.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java项目:SSM共享汽车租赁平台

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 本项目分为前后台,前台为普通用户登录,后台为管理员登录; 管理员角色包含以下功能: 管理员登录…

ElementUI组件-日期时间控件设置禁用日期

ElementUI组件-日期时间控件禁用指定日期 主要属性 查看官网,可以看到有个叫做picker-options的组件属性,没错,就是借助他来完成禁用指定日期的操作,如下 该属性值传入的是一个对象,对于时间选择器、日期选择器、日…

[阶段4 企业开发进阶] 3. 消息队列--RabbitMQ

文章目录1 消息队列1.1 MQ的概念基本介绍使用原因MQ分类如何选择1.2 RabbitMQRabbitMQ核心工作原理安装教程1 消息队列 1.1 MQ的概念 基本介绍 MQ本质是个队列,FIFO 先入先出,只不过队列中存放的内容是 message 而已是一种跨进程的通信机制&#xff0…

[附源码]计算机毕业设计校刊投稿系统Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

Py之removebg:removebg的简介、安装、使用方法之详细攻略

Py之removebg:removebg的简介、安装、使用方法之详细攻略 目录 removebg的简介 1、官网注册获取APIKey removebg的安装 removebg的使用方法 1、直接调用并实现抠图 2、更多案例 removebg的简介 Remove Image Background,是一款不用PS就完成抠图的强…

每日挠头算法题(十五)螺旋矩阵II

“强大方能侠义” ------持续更新Blue Bridge杯入门系列算法实例-------- 如果你也喜欢Java和算法,欢迎订阅专栏共同学习交流! 你的点赞、关注、评论、是我创作的动力! -------希望我的文章对你有所帮助-------- 前言:最近可能…

【Python自学笔记】报错No module Named Wandb

【Python自学笔记】已经装了wandb,还报错No module Named Wandb 方法1.重启cmd和jupyter notebook 直接把窗口和cmd页面全关了,重新打开,再次运行安装和启动代码: !pip install wandbimport wandb wandb.init(project"你自…

【Matlab】一、解常微分方程ODE

文章目录求解常微分方程 ODE(1)求解解析解(2)求解数值解求解常微分方程 ODE ​ 在matlab中,我们可以求解常微分方程的解析解,和数值解,一般使用dsolve来求解常微分方程的解析解,使用…

jsp 上传文件及实体信息,ajax post 请求(formdata)报错400<======>前后端代码示例

Content-Type最常见的几种类型: 通常,没有声明,默认application/x-www-form-urlencoded application/x-www-form-urlencoded form表单默认的数据格式,提交的数据形式 key1val1&key2val2(参数少) mu…

[附源码]计算机毕业设计线上社区管理系统Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

〖全域运营实战白宝书 - 高转化文案速成篇③〗- 高打开率标题型文案的10大黄金法则

大家好,我是 哈士奇 ,一位工作了十年的"技术混子", 致力于为开发者赋能的UP主, 目前正在运营着 TFS_CLUB社区。 💬 人生格言:优于别人,并不高贵,真正的高贵应该是优于过去的自己。💬 &#x1f4e…

第一期 | 整洁,从桌面开始

文章目录前言一、主要内容介绍二、文件分类,整理你的桌面1.网格对齐图标,取消自动排列2.保持工作状态,提取近期文件3.用好排序,让文件一目了然4.分类整理,让文件听你的话5.按照实际情况作调整三、合理归档,…

[附源码]JAVA毕业设计框架的企业机械设备智能管理系统的设计与实现(系统+LW)

[附源码]JAVA毕业设计框架的企业机械设备智能管理系统的设计与实现(系统LW) 目运行 环境项配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支…

文献阅读-VQAR-基于计算机视觉和自然语言处理的信息检索技术综述

VQAR: Review on Information Retrieval Techniques based on Computer Vision and Natural Language Processing 标题:VQAR-基于计算机视觉和自然语言处理的信息检索技术综述 Authors:Shivangi ModiDhatri Pandya Journal:2019 3rd Inter…

在Docker中运行Dubbo应用,详细教程,一学就会

Dubbo概述 Dubbo是阿里开源的一个分布式服务框架,在国内粉丝很多。官网上的介绍是: DUBBO是一个分布式服务框架,致力于提供高性能和透明化的RPC远程服务调用方案,是阿里巴巴SOA服务化治理方案的核心框架,每天为2,000…

Spring_第2章_注解开发+整合Mybatis+Junit

Spring_第2章_注解开发整合MybatisJunit 文章目录Spring_第2章_注解开发整合MybatisJunit一、第三方资源配置管理1 管理DataSource连接池对象问题导入1.1 管理Druid连接池【重点】1.2 管理c3p0连接池2 加载properties属性文件【重点】问题导入2.1 基本用法2.2 配置不加载系统属…

浅谈Android输入法(IME)架构

简介: 输入法 (IME) 是一种可让用户输入文本的用户控件。Android 提供了一种可扩展的输入法框架。借助该框架,应用可以为用户提供备选输入法,例如屏幕键盘,甚至语音输入。安装所需的 IME 后,用户可以从系统设置中选择要…

每日一题:斐波那契数列

每日一题:斐波那契数列 我们先来看一下斐波那契数列的定义: 斐波那契数列(Fibonacci sequence),又称黄金分割数列,因数学家莱昂纳多斐波那契(Leonardo Fibonacci)以兔子繁殖为例子而…

Linux进程调度(二)——主动调度

目录 分析__schedule() 第一步: 第二步: pick_next_task的实现如下: 第三步: 进程上下文切换 内存空间的切换: 寄存器和栈的切换switch_to 指令指针的保存与恢复 总结 进程的调度分为两种方式,本篇…

MOOC——多项式加法(5分)好难!

1.多项式加法(5分) 题目内容: 一个多项式可以表达为x的各次幂与系数乘积的和,比如: 2x63x512x36x20 现在,你的程序要读入两个多项式,然后输出这两个多项式的和,也就是把对应的幂…