数仓数据建模中的概念总结(数据域、主题域、总线矩阵、指标...)

news2024/10/5 16:23:30

概念归纳

  • 业务分类:业务板块是某一大类业务的指标和维度的集合,如电商,文 娱。

  • 数据域:面向业务分析,将业务过程或者维度进行抽象的集合,如交易域, 日志域。
    将零散的需求分类,后续一一展开,这个过程叫数据域划分。数据域需要抽象提炼、并且长期维护和更新的,但不轻易变动。在划分数据域时, 既能涵盖当前所有的业务需求,又能在新业务进入时无影响地被包含进已有的数据 域或者扩展新的数据域。 在这里插入图片描述
    事实表为了更好地进行分析,往往会冗余一些维度属性,例如交易域的“购买商品”业务过程,会冗余店铺、商品、会员等维度信息,因此,我们还需要分析业务过程与维度的关联关系,这个时候,就要用到总线矩阵了。

  • 总线矩阵:是一种在全局视角理解数据结构的一种工具,可以让相关人员对整个数 仓结构能够有清晰了解,很容易就能看出来数据域与业务过程、维度的关系;以及 业务过程与维度的关系。在这里插入图片描述

  • 业务过程:业务过程指企业的业务活动事件,如下单,支付。

  • 数据集市:面向某个应用场景或者产品的数据组织,一般会依赖数据 公共层。

  • 主题域:将数据集市按照分析视角进行切分,比如在电商行业,通常分 为会员、交易、商品等。

• 业务过程与维度的关系:方便开发时对照需要冗余的维度属性。
• 数据域与业务过程/维度的关系:方便开发时就做好数据资产的归类,便于后续
复用。

  • 维度:维度是用于分析数据的一个角度,一方面对维度进行可控管理, 另一方面指导维度表的设计,如地理维度,时间维度。
  • 维度属性:维度属性隶属于一个维度,用来描述维度的属性,如地理维 度中的国家名称,省份名称。
  • 时间周期:时间周期是用来明确数据统计的时间范围或者时间点,如 最近 30 天,自然周。
  • 修饰词:修饰词是对指标统计业务范围的划定,指除了统计维度外指 标的业务场景的限定抽象,如 PC 端,无线端。
  • 原子指标:原子指标是一般不可再细分的度量,原子指标命名=业务过 程+度量。如支付金额,访问人数。
  • 派生指标:派生指标直接用于汇总表的字段,派生指标由原子指标、时间周期、修饰词(可选)组成,如最近 1 天海外买家支付金额。在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/954900.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VSCode配置C语言环境(简单易懂,小白专用)

1.在VSCode中安装C/C插件和C/C Extension Pack插件 2.下载mingw64 mingw64官网网页链接 1、找到downloads ​​​​​​​​ 2、找到SourceForge 3、找到一个合适的版本(我这里是下拉找到免安装版)下载,其他的都试过了,都不行&a…

window11,C盘瘦身减肥技巧

创作灵感 本文主要说明如何给windows11的C盘进行空间优化,或者叫减肥瘦身,让其达到20G以内。绝大部分内容,也适用于window10和windows7,只是操作系统不同,操作方式略有不同。不关注C盘空间的读者,可以忽略…

rsync命令介绍与使用案例

一、rsync命令简介 Rsync命令是一个常用的用于文件传输和同步的工具,rsync 可以理解为 remote sync(远程同步),为了减少网络数据发送量,只发送源文件和目标文件之间的差异信息,从而实现数据的增量的复制。它…

DP3232 国产RS-232接口收发器芯片

DP3232是一个3.3 V.供电的 EIA/TIA-232和 V.28/V.24通信接口,具有低功耗要求、高数据速率能力。DP3232拥有一个专有的低压差发射机输出平台,提供真正的 RS-232性能,从3.3 vV 到5.5 V 电源。该设备只需要四个小的0.1 μF 标准外部电容器从3.3 …

原生小程序 wxs 语法(详细)

WXS WXS(WeiXin Script)是内联在 WXML 中的脚本段。通过 WXS 可以在模版中内联少量处理脚本,丰富模板的数据预处理能力。另外, WXS 还可以用来编写简单的 WXS 事件响应函数。 从语法上看, WXS 类似于有少量限制的 Java…

LOIC(low orbit ion cannon)

前言 重要的话说三遍: 该程序仅用于学习用途,请勿用于非法行为上!!! 该程序仅用于学习用途,请勿用于非法行为上!!! 该程序仅用于学习用途,请勿用于非法行为上…

麒麟系统查看飞腾CPU的工作模式、实时频率的方法

CPU动态节能技术用于降低功耗,通过选择系统空闲状态不同的电源管理策略,可以实现不同程度降低CPU功耗,更低的功耗策略意味着CPU唤醒更慢对性能影响更大。本文这里讲解了如何使用命令查看系统下CPU的工作模式,和实时频率。 测试用系统信息: # cat /etc/os-releaseNAME=&qu…

com.google.guava:guava 组件安全漏洞及健康分析

组件简介 维护者google组织许可证类型Apache-2.0首次发布2010 年 4 月 26 日最新发布时间2023 年 8 月 1 日GitHub Star48189GitHub Fork10716依赖包28,694依赖存储库219,576 Guava 是 Google 的一组核心 Java 库,其中包括新的集合类型(例如 multimap 和…

《自然》杂志最新研究成果,新冠卷土重来,仍然凶险,别不当回事儿

我同事又带口罩了,他说已阳。我很奇怪怎么不认为是感冒呢? 他低声地说,家里还有去年囤的试剂盒,我测了一个。 我还好,只在年初时候阳过一次。 应该说,我们比较庆幸,新冠毒株已经温和&#xff0c…

linux服务磁盘满了操作

1、使用xshell连接上服务器 2、# df -h 查看系统磁盘使用情况 3、查看使用比较多的文件,cd 跳转到该文件夹下,ls 查看文件 # du -h查看该文件夹下各个文件大小 4、查找logs文件 ,删除logs 文件内容 使用 删除名为directory下的所有文件…

杭州华宫养老服务有限公司官网上线 | LTD养老服务行业案例分享

数字化时代,养老服务行业也逐渐的意识到借助互联网进行营销的重要性,但是,随着互联网渠道成本的不断攀升,如何获取稳定流量成为养老服务机构目前所面临的重要挑战。 于是,杭州华宫养老服务有限公司作为养老服务行业崛…

深圳产品展示视频拍摄一站式服务

产品展示视频拍摄一站式服务是指一家专业的拍摄制作公司或团队提供从策划、拍摄到后期制作的全方位服务,以满足客户的产品展示需求。这种服务通常包括以下方面,由产品展示视频制作公司老友记小编从以下几个方面为您整理: 1.策划和预制阶段&a…

黑客组织“Anonymous”进行网络攻击抗议日本排放核污水

概述 近期全球都在关注日本核污水排放,起因是日本政府宣布,福岛第一核电站核污染水8月24日开始排入海洋,计划排放30年。那么这件事为什么会引起全球关注呢,大家通过美国对日本投放原子弹后果,导致广岛长崎任然处于核辐…

Java SPI 机制

文章首发于个人博客,欢迎访问关注:https://www.lin2j.tech 什么是 SPI 机制 SPI (Service Provider Interface)是 Java 内置的一种服务提供发现机制,将功能的实现交给第三方,用来拓展和替换组件。 SPI 的…

ESB(Enterprise Service Bus,即企业服务总线)

以前用过部分功能,但是没有很好地去理解过。 ESB(Enterprise Service Bus,即企业服务总线)是传统中间件技术与XML、Web服务等技术结合的产物。ESB提供了网络中最基本的连接中枢,是构筑企业神经系统的必要元素。 企业服…

【Bug】Ubuntu 有线设置打不开无反应

前言: 突然有线设置就没法启用了,但是能联网,能查看ip 解决: 最后安装了一个新的依赖包: sudo apt install gnome-control-center 然后就可以了 还有一个方法,没试过,但感觉有点道理的&#…

《向量数据库》——为何向量数据库对大模型LLM很重要?

当您浏览Twitter、LinkedIn或新闻源上的时间轴时,可能会看到一些关于聊天机器人、LLM和GPT的内容。因为每周都有新的LLM发布,很多人都在谈论LLM。 我们目前置身于一场人工智能革命,许多新应用都依赖于向量嵌入。不妨让我们更多地了解向量数据库以及为什么它们对LLM很重要。…

【UIPickerView-UIDatePicker-应用程序对象 Objective-C语言】

一、今天我们来学习三个东西 1.UIPickerView-UIDatePicker-应用程序对象 1.首先,来看数据选择控件 数据选择控件, 大家对这个数据选择控件,是怎么理解的, 1)数据选择控件,首先,是不是得有数据, 2)然后呢,你还得让用户能够选择, 3)最后,你还得是一个控件儿 那…

MySQL 数据库常用命令大全(详细)

文章目录 1. MySQL命令2. MySQL基础命令3. MySQL命令简介4. MySQL常用命令4.1 MySQL准备篇4.1.1 启动和停止MySQL服务4.1.2 修改MySQL账户密码4.1.3 MySQL的登陆和退出4.1.4 查看MySQL版本 4.2 DDL篇(数据定义)4.2.1 查询数据库4.2.2 创建数据库4.2.3 使…

Python UDP编程

前面我们讲了 TCP 编程,我们知道 TCP 可以建立可靠连接,并且通信双方都可以以流的形式发送数据。本文我们再来介绍另一个常用的协议--UDP。相对TCP,UDP则是面向无连接的协议。 UDP 协议 我们来看 UDP 的定义: UDP 协议&#xff…