如何理解数据模型?颗粒度、维度及指标?

news2024/11/15 23:33:58

问题1 什么是数据模型?

数据模型反映在数据库中就是一张表,该表把他分开来看有以下关注的点。

(1)主键:表明该表主要的分析对象,比如我们的分析对象是订单、是商品、是门店,那么主键就是订单id,商品id,门店id等

(2)颗粒度:数据的颗粒度是指数据的 “粗细”,也就是我们看数据的视野的大小,或者说格局的大小。反应表中一行数据所代表的细节程度,简单理解就是该行数据反应了什么样的业务,具体到哪种细节程度。也是我们进行分析、汇总、关联的最小单元。

例如一个电商公司,同样是看GMV,也就是总销售额,CEO关注的可能是今年总的GMV是多少,而业务老板关注的可能是每个月的GMV如何,具体到某个小团队,关注的点可能就是某些商品,每天的GMV如何了。数据颗粒度最常见的划分是时间

分析对象(主键)+ dt 共同构成了数据的颗粒度

例如:某个门店(对象)每月(时间)的GMV

 

(3)关系:构建实体与实体之间的关系,有一对一,一对多,多对多。比如门店与顾客之间的关系,属于1对多,一个门店有多个顾客来购买商品。

(4)行为指标:即指标、度量。用来描述该对象发生了什么事情。你如XX顾客在该门店近一个月购买了多少件商品。

   本质是一种面向对象思想,对象里面有属性和方法,对象即实体,对应数据库中的表模型,对象由主键来确定,属性即表中的维度,方法即行为指标。

 

问题2:颗粒度与维度之间的区别? 

维度:指看待事物不同的角度。可以理解为对象的属性,是对同一实体更细粒度的拆分。

比如我们小学的时候就学过横看成岭侧成峰,说的就是从不同角度来看一座山,会得到不同的结论。在做数据分析时也是一样的。分析一个活动,或者一个策略对用户的吸引时,如果我们以新增用户数作为分析的指标,我们可以从以下几个维度进行拆分:

  • 时间维度:拆分为天、月、季度、年
  • 性别维度:男性、女性、未知
  • 受教育程度:小学、中学、大学、研究生、博士、其他

通过维度的分解,我们可以看到每个部分的变动,和整体的变化趋势是否相同,是否存在不同,而哪些不同点往往会成为我们接下来分析的重点。 

是不是会有同学发现,颗粒度和维度有一些相似,例如时间这个要素,在两个部分都出现了。那么颗粒度和维度的主要区别在哪呢?

  • 颗粒度和维度的本质区别在于拆分的模式不同 

  • 颗粒度是一种纵向的拆分模式,按业务实体,业务过程进行纵向拆分,不同的颗粒度都代表着不同的聚合程度。
  • 维度是一种横向拆分的模式。是在同一对象(实体)下进行的横向拆分,指的该对象的水平扩展能力,按不同维度展开分析。
  • 比如实体对象X=A+B+C+D,对象X可以按照A,B,C,D四个维度进行拆分出来进行分析,而将所有的维度组合又可以形成X整体。对象Y=1+2+3+4,1,2,3,4属于实体Y的维度,而对象X,Y则属于不同的颗粒度。

问题3:什么是指标,指标的具体含义是什么?

指标定义:指标是对业务发展现状的描述和度量。作用:是对当前业务发展好坏的评价。本质上他是一种度量(mesuare《=》metric),是数据分析的基础。
指标意义:实际上是业务固化下来的产物,可以长期监控业务发展趋势,评价业务现状。指标是数据部门与业务部门沟通的桥梁和术语,数据最终的呈现结果即为指标,没有指标数据是没有灵魂的。

指标的作用是“度量”业务,可以从三个角度对指标进行拆解:

指标=维度+统计口径+业务目标。

维度:从什么角度去衡量问题。

统计口径:用什么方法去统计问题。

业务目标:目标是什么。

下面举两个例子。订单量是指统计周期内,用户完成支付的订单数量总和。从维度、统计口径、业务目标三个角度将订单数拆解。

订单量 = 统计周期内,用户完成支付的订单数量总和

维度:用户完成支付订单数量来衡量

统计口径:订单数量总和

业务目标:完成支付订单数。

指标分类:原子指标、派生指标、衍生指标。一般日常使用的即为派生指标,派生指标=原子性指标+时间段+修饰词,三者缺一不可。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1910095.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

烧烤炉发霉怎么处理 烧烤炉发霉的原因分析

仓库储存的烧烤炉表面布满了霉菌是什么原因?烧烤炉发霉不仅影响外观和卖点,若是出口给到客户手上还会导致面临客户的索赔的问题 ,经ihaoer防霉人士介绍烧烤炉发霉处理方法如下: 烧烤炉发霉的原因分析 一、储存的环境潮湿&#xff…

动手学深度学习(Pytorch版)代码实践 -循环神经网络-55循环神经网络的从零开始实现和简洁实现

55循环神经网络的实现 1.从零开始实现 import math import torch from torch import nn from torch.nn import functional as F from d2l import torch as d2l import matplotlib.pyplot as plt import liliPytorch as lp# 读取H.G.Wells的时光机器数据集 batch_size, num_ste…

若依 ruoyi-vue SpringBoot highlight-textarea 输入框敏感词关键词高亮标红(二)

参考文章,非常感谢大佬的分享 实现可高亮的输入框 — HighlightTextarea GitHub:highlight-textarea 可看作者上一篇文章 若依 ruoyi-vue SpringBoot聊天敏感词过滤sensitive-word(一) 效果图 审核时,输入框高亮敏感词&#xff…

由于找不到emp.dll无法运行游戏的多个有效解决方法分享

在玩游戏时候是否遇到过找不到emp.dll,无法继续执行代码问题无法打开游戏?那么这个emp.dll是什么呢?为什么会丢失,emp.dll丢失要怎么办?今天就给大家详细介绍一下emp.dll文件与emp.dll丢失的多个解决方法! 一、emp.dll…

详解[USACO07OPEN] Cheapest Palindrome G(洛谷PP2890)(区间DP经典题)

题目 思路 考虑区间DP。 设dp[i][j]为从i到j这段区间被修正为回文串的最小花费 c[cc][1]为添加字符cc的花费 c[cc][2]为删去字符cc的花费 s为题目给出的字符串。 用[i 1,j]区间转移:这种转移相当于在[i1,j]区间的左边加入一个字符,让[i,j]变为回文的方…

一款专业的 Windows 恶意程序分析与清理工具

大家好,今天给大家分享一款专业的 Windows 恶意程序分析与清理工具OpenArk,它能够帮助用户发现系统中隐藏的恶意软件。 OpenArk是一款Windows平台上的开源Ark工具. Ark是Anti-Rootkit(对抗恶意程序)的简写, OpenArk目标成为逆向工…

农牧行业CRM洞察:打造营、销、服一体化数字营销平台

01、行业应用背景 保持企业活力,支撑业务单元协调发展,稳定核心产品竞争力,将成为农牧行业企业数字化、数智化建设的指导方向。 积极发挥数据在生产、流通、消费各个环节的决策支撑,为农牧企业特别是多业态集团型企业&#xff0…

(附源码)c#+winform实现远程开机(广域网可用)

实现逻辑 利用UDP协议发送特定格式的魔术包,以远程唤醒具有特定MAC地址的目标计算机。目标计算机的BIOS和网络配置需要支持Wake-on-LAN(WOL)功能,并且需要在目标计算机上配置正确的网络唤醒设置。 源码在最后 准备工作 进入Bio…

从混乱到有序:三品产品生命周期管理PLM系统改善工艺管理

在当今竞争激烈的市场环境中,企业必须不断寻求提高效率和降低成本的方法。工艺管理作为产品开发和制造过程中的关键环节,对产品的成本和质量有着决定性的影响。随着信息化和并行化的发展,工艺管理的复杂性日益增加,传统的管理方式…

MATLAB数据统计描述和分析

描述性统计就是搜集、整理、加工和分析统计数据, 使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的基础,实用性较强,在数学建模的数据描述部分经常使用。 目录 1.频数表和直方图 2 .统计量 3.统计…

基于智能座舱视觉DMS/OMS/RMS的简介

基于智能座舱视觉DMS/OMS/RMS的简介 引言 随着智能驾驶技术的迅猛发展,智能座舱逐渐成为汽车科技领域的热点话题。在智能座舱系统中,驾驶员监控系统(DMS)、乘员监控系统(OMS)以及舱室监控系统(…

可视化作品集(10):智慧楼宇大屏,美学效果杠杠的。

追求颜值在智慧楼宇大屏设计中是非常重要的,可以帮助提升用户体验、品牌形象和信息传递效果,为大屏的实际应用和效果带来更多的积极影响。 1. 吸引眼球: 精美的设计和视觉效果可以吸引用户的注意力,让用户更愿意去关注和了解大屏…

scratch绘制四个三角形 2024年6月中国电子学会 图形化编程 scratch编程等级考试二级真题和答案解析

scratch绘制四个三角形 一、题目要求 2024年6月电子学会图形化编程Scratch等级考试二级真题 1、准备工作 1.保留默认角色小猫; 2.添加背景Stars。 2、功能实现 1 .隐藏角色小猫,设置画笔裙始位置为(0,0),画笔颜色为黄色,画笔的粗细为5…

土壤品质检测仪:守护大地之母的科技卫士

土壤,作为地球生命之源,承载着万物的生长与繁衍。然而,随着现代农业的快速发展,土壤品质问题日益凸显,对农作物的生长和人们的健康构成了潜在威胁。 随着环保意识的增强和农业可持续发展的需求,土壤品质检测…

FreeRTOS——任务通知

一、任务通知 1.1 任务通知简介 任务通知:用来通知任务的,任务控制块中的结构体成员变量 ulNotifiedValue就是这个通知值 (1)使用队列、信号量、事件标志组时都需另外 创建一个结构体 ,通过中间的结构体进行间接通信…

文华财经多空波段均线交易黄金分割线指标公式源码

文华财经多空波段均线交易黄金分割线指标公式源码: 多:EMA(C,3),COLORYELLOW; 空:EMA(C,5),COLOR00FF00; 均衡:EMA(空,5),COLORWHITE; VARF1:COUNT(CROSS(多,均衡),2)1; VARF2:COUNT(CROSS(空,均衡),2)1; ZAI:FILTER(VARF1 AND VARF2,2); DRAWTEXT(ZAI,均衡*…

浅谈VPS主机上的数据库性能优化

如何提高网站性能?一个显而易见的解决方案是升级托管账户。您的网站将拥有更多硬件资源,因此可以同时处理更多请求并更快地传递数据。 无论如何,人们都是这么认为的。但事实总是不一样。 现代网站是一个复杂的系统,包含许多必须…

迅狐抖音机构号授权矩阵系统源码

在数字化营销的浪潮中,抖音以其独特的短视频形式迅速崛起,成为品牌传播和用户互动的重要平台。迅狐抖音机构号授权矩阵系统源码作为一项创新技术,为品牌在抖音上的深度运营提供了强大支持。 迅狐抖音机构号授权矩阵系统源码简介 迅狐抖音机…

7/8 复盘

后端数据传输? 后端代码的耦合:打点调用、方法调用、接口、继承。 Dao、Service、servlet(controller)各层的作用? Dao负责与数据库交互,执行SQL语句,例如简单的增删改查等等。(要创建对应的接口和实现类…

从RL的专业角度解惑 instruct GPT的目标函数

作为早期chatGPT背后的核心技术,instruct GPT一直被业界奉为里程碑式的著作。但是这篇论文关于RL的部分确写的非常模糊,几乎一笔带过。当我们去仔细审查它的目标函数的时候,心中不免有诸多困惑。特别是作者提到用PPO来做强化学习,…