浅谈关于数据仓库的理解,聊聊数据仓库到底是什么?

news2024/10/6 20:35:38

不知不觉间,我们的生活中已经充满了数据,各种岗位例如运营、市场、营销上也都喜欢在职位要求加上一条利用数据、亦或是懂得数据分析。事实上,数据已经成为了构建现代社会的基本生产要素,并且因为不受自然环境的限制,已经成为了人们对未来社会发展方向的共识。也正是这些,所以数据仓库的讨论的开始逐步增加。

近几年的时间里,因为自助BI、敏捷BI的兴起,很多企业在部署商业智能BI的时候,经常会询问是否需要建设数据仓库,一时间数据仓库成为了商业智能BI中的负面影响源头。其实这主要是因为很多人不太明白数据仓库到底在商业智能BI项目中发挥了什么作用,所以引发了很多争论。

在讨论数据仓库前,我有一个问题,有数据仓库的话,商业智能BI就不能自助分析、不能敏捷开发了吗?商业智能BI的数据仓库听起来和数据库也差不多,是不是换了个名头?数据仓库中备受重视的维度、指标又是什么,对于企业有何意义?下面我们带着问题浅谈下商业智能BI数据仓库。

数据仓库是什么

事实上,很多人在看到数据仓库的第一眼,就把数据仓库当成了数据库。当然这也很正常,毕竟从名字来看这两者确实区别不大,真正区分两者的是定位、作用等更深一层的东西。不过在这里还是先解释数据仓库的概念,不同之处后边会进行详细讲解。

数据仓库是一个面向主题的、集成的、随时间变化但信息本身相对稳定的数据集合,用于支持管理决策过程。其本质就是完成从面向业务过程数据的组织管理到面向业务分析数据的组织和管理的转变过程,也是商业智能BI中数据仓库的主要作用。

数据仓库 - 派可数据商业智能BI可视化分析平台

数据仓库就像企业的总的大仓库,能够存储不同来源、不同格式的数据,并且可以通过ETL和数据模型,对数据进行高质量的筛选,分级分类进行存储。具有很强的稳定性,不会频繁的进行增删改等操作,能够反应历史变化。

用通俗的话来说就是数据仓库就像一个终端的大仓库,其他小仓库的各种货品会通过各种方式统一存储到这里,然后通过仓库位置的划分、货品的摆放进行归纳分类,实现规范、标准的从存放,到分类,再到使用的完整过程。

数据仓库和数据库有什么不同

其实数据仓库和数据库跟现实中的仓储系统是有很多相似之处的,企业各部门的数据库就相当于一个个小的产业库,对应了企业的各个部门。而数据仓库相当于是一个终端仓库,其中存储的物品是由各个小的仓库运送的,是各个数据库的集合体,一个更大的综合数据库。

业务数据 - 派可数据商业智能BI可视化分析平台

此外,数据库和数据仓库最不同的还是服务对象和作用。上边也提到了,数据库基本上是服务于各个部门,是业务信息系统的附属品,也就是我们常在信息化建设初期中提到的ERP、OA、CRM等业务系统。这些数据库是服务于各种业务系统以及业务软件,主要是通过业务流程发挥作用。

而数据仓库就不一样了,它不是服务于业务信息化系统的,它是服务于分析型应用的。更多的是通过各种商业智能BI前端可视化分析工具或者报表工具来访问数据仓库,最终是面向报表查询,数据分析服务,为业务人员提供复盘、预测,为企业管理人员提供决策信息的。

数据仓库建模方式

在Kimball和Inmon两位数据仓库领域大佬不同方向的经验指导下,数据仓库的建模已经是一个成熟的体系,可以根据需求选择不同的方式,既有三范式 3NF 建模,也有维度建模比如星型或雪花型的建模方式。

数据仓库 - 派可数据商业智能BI可视化分析平台

数据仓库还有着分层结构,每个分层结构都有各自的作用,比如经常看到的ODS 层、Trans 层、Dimension 层、Data Mart 层等,都是为了将数据从大海中进行筛选,从分散到集中进行高度汇总,形成一个个的主题,为后续的前端数据可视化分析提供数据的支撑。

数据仓库为了业务分析的目的,因此需要拉通各个业务系统数据库的数据,保留大量历史数据,同时为了分析效率的提升改变了传统数据库的数据组织形式,例如利用适合于分析型模型的Kimball维度建模方式来组织底层数据架构。

数据可视化分析 - 派可数据商业智能BI可视化分析平台

数据仓库服务于商业智能BI分析,通过商业智能BI前端可视化分析工具来访问,是其中不可或缺的一部分。并且在长期的建设中,商业智能BI已经形成了一套直接零代码配置并完成数仓建模的整个过程,进行了完整的产品化,解决了困难的架构与模型的问题。

数据仓库作为商业智能BI系统中的一部分,已经成长为了企业信息化建设中必不可少的重要支撑,在可见的未来,数据仓库还会随着信息化、数字化技术、理念、应用的落地,继续成长。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1124144.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小白也会的校园网宽带拨号自动重连设置

开始菜单搜索“任务计划程序”:我这个开始菜单和你们的不太一样,用了StartAllBack设置的,总之能找到这个程序就行了 提示:可以按下“Win R”,打开“运行”,输入taskschd.msc来打开任务计划程序 点击“任务…

1024程序员狂欢节有好礼 | 前沿技术、人工智能、集成电路科学与芯片技术、新一代信息与通信技术、网络空间安全技术

🌹欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流 1024程序员狂欢节有好礼 🚩🚩🚩点击直达福利前言一、IT技术 IT Technology《速学Linux:系统应用从入门到精通》《Pytho…

Spring Event

前言 ApplicationEvent 与 ApplicationListener 应用 实现 基于注解 事件过滤 异步事件监听 好处及应用场景 源码阅读 总结 1前言 ApplicationContext 中的事件处理是通过 ApplicationEvent 类和 ApplicationListener 接口提供的。如果将实现了 ApplicationListener …

重磅|博睿数据 Bonree ONE 2023秋季版焕新发布!

2023年10月20日,以「数智融,ONE向新」为主题的 Bonree ONE 秋季产品发布会在深圳圆满落幕。此次发布会上,博睿数据隆重发布新一代一体化智能可观测平台——Bonree ONE秋季正式版,重点升级数据采集、全局拓扑、数据分析、会话回放等…

vue 使用$router.push(参数)跳转同一路由页面,参数不同,跳转页面数据均为最后一次传值数据

问题描述:项目中,使用$router.push(参数)跳转同一路由页面,打开多个tab,数据均为最后一次打开的数据; 1、列表页面 2、从1进入的编辑详情: 3、从2进入的编辑详情: 4、此时1的编辑详情内容也变…

第二届、第三届<火焰杯>软件测试开发选拔赛河北赛区颁奖典礼落幕

河北新闻网讯&#xff08;燕赵都市报纵览新闻记者 张超&#xff09;3月25日下午&#xff0c;第二届、第三届<火焰杯>软件测试开发选拔赛河北赛区颁奖典礼在河北工程技术学院图书馆报告厅隆重举行。 出席典礼的领导及嘉宾有&#xff1a;河北工程技术学院副校长田光、教学…

常用Web安全扫描工具汇整

漏洞扫描是一种安全检测行为&#xff0c;更是一类重要的网络安全技术&#xff0c;它能够有效提高网络的安全性&#xff0c;而且漏洞扫描属于主动的防范措施&#xff0c;可以很好地避免黑客攻击行为&#xff0c;做到防患于未然。 1、AWVS Acunetix Web Vulnerability Scanner&a…

中国大模型开源创新与合作的新篇章 | 2023 CCF中国开源大会

2023年10月21日至22日&#xff0c;由中国计算机学会&#xff08;CCF&#xff09;和开放原子开源基金会联合主办的CCF中国开源大会&#xff08;CCF ChinaOSC&#xff09;在湖南省长沙市北辰国际会议中心成功召开。此次大会以“开源联合&#xff0c;聚力共赢”为主题&#xff0c;…

硬件信息查看工具 EtreCheckpro mac中文版功能介绍

etrecheckpro mac中文版是一款专业的硬件信息查看工具&#xff0c;它能够快速的检测Mac电脑的软硬件信息&#xff0c;加强用户对自己计算机的了解&#xff0c;EtreCheckPro for Mac下载首先会对电脑的软硬件信息进行扫描收集&#xff0c;之后才会显示出来。EtreCheck Mac版报告…

数据结构 哈希表

数据结构 哈希表 文章目录 数据结构 哈希表1. 概念2. 冲突-概念3. 冲突-避免3.1 哈希函数设计3.2 负载因子调节 4.冲突-解决4.1 闭散列4.2 开散列(哈希桶)4.3 哈希桶实现 5. 性能分析6. 和java类集的关系 1. 概念 顺序结构以及平衡树中&#xff0c;元素关键码与其存储位置之间…

k8s----11、service

services 1、概述2、存在的意义2.1 服务发现2.2 负载均衡 3、pod与service的关系4、service 三种类型4.1 、 ClusterIP4.2 、NodePort4.3 、LoadBalancer 1、概述 Service 是 Kubernetes 最核心概念&#xff0c;通过创建 Service,可以为一组具有相同功能的容器应 用提供一个统…

说说腾讯云新用户那些事以及产品首单说明

腾讯云新用户是什么意思&#xff1f;新用户是指从未在腾讯云购买过云产品的用户&#xff0c;新用户可以购买特价服务器你不会不知道吧&#xff1f;一定要珍惜你的新用户资格&#xff0c;因为腾讯云很多优惠价格都是新用户专享的。腾讯云百科txybk.com来详细说下什么是腾讯云新用…

Windows安装cygwin + swoole,并配置crontab定时任务

一、Windows安装cygwin 安装包下载 自行搜索安装包进行下载&#xff0c;目前官网无法打开。官网地址&#xff1a;http://www.cygwin.com/ cygwin安装详细教程 1. 打开安装包&#xff1a;setup-x86_64.exe 2. 点击“下一页”&#xff0c;选择第一种方式后再点击“下一页” 3…

NFTScan | 10.16~10.22 NFT 市场热点汇总

欢迎来到由 NFT 基础设施 NFTScan 出品的 NFT 生态热点事件每周汇总。 周期&#xff1a;2023.10.16~ 2023.10.22 NFT Hot News 01/y00ts&#xff1a;迁移回以太坊的跨链桥已上线&#xff0c;将承担第一天所有 Gas 费 10 月 16 日&#xff0c;y00ts 发推称&#xff0c;将 y00…

Etsy店铺防防关联,自养号防关联环境搭建要点

Etsy是美国一个在线销售手工工艺品的网站&#xff0c;主要为客户提供定制化的手工制品和古董收藏品等。同时&#xff0c;该平台还为设计师、工匠和买家提供了一个可靠的交易平台。 在Etsy平台上&#xff0c;用户可以开设店铺&#xff0c;销售各类产品&#xff0c;包括摄影、艺…

halcon 多车牌识别

文章目录 车牌定位字符分割字符识别多张图片 车牌定位 dev_close_window() dev_open_window(0,0,512,400,black,WindowHandle) list_image_files(C:/Users/Augustine/Desktop/车牌照图片,jpg,[],ImageFiles) for i:0 to |ImageFiles|-1 by 1read_image(Image, ImageFiles[i])*…

GoLong的学习之路(一)语法之变量与常量

目录 GoLang变量批量声明变量的初始化类型推导短变量声明匿名变量 常量iota&#xff08;特殊&#xff09;&#xff08;需要重点记忆&#xff09; GoLang go的诞生为了解决在21世纪多核和网络化环境越来越复杂的变成问题而发明的Go语言。 go语言是从Ken Thomepson发明的B语言和…

RPA对财务报表的影响

在企业的财务管理中&#xff0c;财务报表分析能够帮助管理人员及时掌握企业的生产经营状况与财务状况&#xff0c;并为管理人员的科学决策提供财务数据支撑&#xff0c;规避企业经营风险。然而&#xff0c;传统的财务报表准备过程通常是繁琐、耗时和容易出错的&#xff0c;RPA技…

如何给R128在FreeRTOS下配置/data目录

在调试音频、usb等模块时&#xff0c;会发现SDK的根目录下没有/data该目录&#xff0c;导致无法存储所需要的文件&#xff0c;这就是因为/data目录没有配置好的原因。 1、选上配置 首先需要选上的配置&#xff1a; 运行mrtos_menuconfig&#xff0c;选上COMPONENT_LITTLEFS …

IDC报告:腾讯云领跑工业云市场,装备制造领域位列行业第一

10月23日&#xff0c;全球领先的IT市场研究和咨询公司IDC发布了《中国工业云IaaSPaaS市场份额&#xff0c;2022&#xff1a;分化初现》报告&#xff0c;腾讯云凭借领先的技术优势和助力实体经济数字化转型成果&#xff0c;成为头部厂商中增速最快的云计算厂商。在装备制造领域&…