数据库 与 数据仓库的本质区别是什么?

news2024/11/26 23:21:41

当用计算机来处理数据的时候, 数据就需要存储和管理了。早期的数据, 就是用一个文件来实现的, 即是文件系统。随着处理的数据量增大, 发展到用数据库来管理和存储数据了。

数据库包括多媒体数据库、对象关系数据库和关系数据库。关系数据库管理系统,已经成为了事实上通用的数据库系统, 因为它以关系表格式存储数据,并以简单明了的SQL标准的格式对数据进行存取。

随着数据量的增多,人们开始寻找各种数据之间的关系, 研究面向某一主题的数据, 于是数据仓库问世了。数据仓库是历史的、主题的、集成的大量数据, 以多维的角度分层次分析数据之间的关系, 提供数据挖掘功能, 寻找数据间的知识, 为决策支持提供服务。

因此,数据库和数据仓库都是与数据相关的。

一、数据库与数据仓库的概念

1、数据库

(1)概念

数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。数据库有很多类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。

(2)数据库的特点

实现数据共享:数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。

减少数据的冗余度:同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。

数据的独立性:数据的独立性包括逻辑独立性和物理独立性。

数据的集中控制:文件管理方式中,数据处于一种分散状态,不同用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。

数据的一致性和可维护性:①安全性控制:以防数据丢失、错误更新和越权使用;②完整性控制:保证数据的正确性、有效性和相容性;③并发控制:在同一时间周期内,允许对数据实现多路存取,能防止用户之间的不正常交互作用。

故障恢复:由数据库管理系统提供一套丰富,可及时发现故障和修复故障,从而防止数据被破坏。

2、数据仓库

(1)概念

数据仓库,是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,对多样的业务数据进行筛选与整合。

(2)数据仓库的特点

主题性:传统数据库中,最大的特点是面向应用进行数据的组织,各个业务系统可能是相互分离的。而数据仓库则是面向主题的。主题是一个抽象的概念,是较高层次上企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。

操作型处理(传统数据)对数据的划分并不适用于决策分析。而基于主题组织的数据则不同,它们被划分为各自独立的领域,每个领域有各自的逻辑内涵但互不交叉,在抽象层次上对数据进行完整、一致和准确的描述。一些主题相关的数据通常分布在多个操作型系统中。

集成性:通过对分散、独立、异构的数据库数据进行抽取、清理、转换和汇总便得到了数据仓库的数据,这样保证了数据仓库内的数据关于整个企业的一致性。

数仓不是生成数据的平台,其数据来自于各个不同的数据源,当我们确定主题之后,就需要把和主题相关的数据从各个数据源集成过来。因为同一个主题的数据可能来自不同的数据源,它们之间会存在着差异(异构数据)。因此在数据进入数据仓库之前,必然要经过统一与综合,这一步是数据仓库建设中最关键、最复杂的一步,所要完成的工作有:

要统一源数据中所有矛盾之处,如字段的同名异义、异名同义、单位不统一、字长不一致,等等;进行数据综合和计算。数据仓库中的数据综合工作可以在从原有数据库抽取数据时生成,但许多是在数据仓库内部生成的,即进入数据仓库以后进行综合生成的。

稳定性:数据仓库中保存的数据是一系列历史快照,不允许被修改。

时变性:数据仓库包含各种粒度的历史数据。数据仓库中的数据可能与某个特定日期、星期、月份、季度或者年份有关。数据仓库的目的是通过分析企业过去一段时间业务的经营状况,挖掘其中隐藏的模式。虽然数据仓库的用户不能修改数据,但并不是说数据仓库的数据是永远不变的。分析的结果只能反映过去的情况,当业务变化后,挖掘出的模式会失去时效性。因此数据仓库的数据需要更新,以适应决策的需要。从这个角度讲,数据仓库建设是一个项目,更是一个过程。

二、数据库与数据仓库的区别

数据库与数据仓库的区别实际讲的是OLTPOLAP的区别。

操作型处理,叫联机事务处理OLTP(On-Line Transaction Processing,),也可以称面向交易的处理系统,它是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理。

分析型处理,叫联机分析处理OLAP(On-Line Analytical Processing)一般针对某些主题的历史数据进行分析,支持管理决策。

首先要明白,数据仓库的出现,并不是要取代数据库。

企业中一般先有数据库,然后有数据仓库,可以没有数据仓库,但是不能没有数据库。数据仓库不是大型的数据库,只是一个数据分析的平台。

数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它绝不是所谓的“大型数据库”。

具体而言,数据库与数据仓库的区别有以下几点:

1、数据库是面向事务的设计,数据仓库是面向主题设计的。

2、数据库一般存储业务数据,数据仓库存储的一般是历史数据。

3、数据库设计是尽量避免冗余,一般针对某一业务应用进行设计。数据仓库在设计时有意引入冗余,依照分析需求,分析维度、分析指标进行设计。

4、数据库是为捕获数据而设计,数据仓库是为分析数据而设计。

三、数据库与数据仓库的应用

下面小亿以亿信华辰为江苏金租建设的一体化数据分析管理平台为例,具体讲讲数据仓库的应用。

点这里,免费申请数据治理产品~

1、项目背景

金融统计历来是监管机构非常重视的一项基本工作,每年都会对金融统计制度进行修订,不断细化和完善统计要求,在此背景下,公司也在不断的开展各类业务数据规范、完善业务基础数据采集的工作。但由于缺乏统一化的数据平台,使得各类监管报表的生成质量无法得到有效保证。

另外,随着业务的快速发展,中小企业业务逐步增多,公司对精细化管理提出更高要求,内外部数据的使用、统计、分析工作成为日常办公的基本需要,信息中心在数据服务方面的提升迫在眉睫,同时各部门也对数据服务的提供方式、提供的时效性、使用的灵活性提出了较高要求。目前江苏金租公司主要面临以下几个问题:

(1)数据信息孤岛问题

随着公司的日渐发展及业务的逐步扩大,江苏金租公司的业务系统也逐步增多。目前主要的就有大单、零售、助融、财务、资金、OA、HR七大系统数据,各系统之间的数据缺乏关联性,数据无法统一标准,容易形成“蛛网结构”,出现重复开发,浪费IT资源和成本的问题。

(2)缺乏精细化的管理

江苏金租目前在数据展示方面缺乏成熟的平台,公司管理层和业务部门人员无法及时获知公司和部门经营管理情况,动态调整公司和部门重点工作,更好的指导团队完成各项经营指标,从而做不到精细化的管理。

(3)数据的多维分析能力不足

江苏金租各部门及业务人员数据分析大多依赖于系统自身或者用户手动处理数据,但是由于业务系统缺乏历史数据并且各个系统比较分散,无法做到多维度地分析数据。

(4)信息安全管控问题

公司各部门及业务人员在进行数据分析是主要依赖于业务系统,但是这样操作权限控制不足,业务人员经常能够查看到一些其他部门或业务人员的数据,而且针对于一些对外报表,其中的一些敏感信息例如人员姓名、证件号码等关键信息无法进行脱敏处理,容易导致公司核心数据泄露问题。

2、项目建设情况

综合考量内外部需求,江苏金租启动数据平台建设项目,本阶段以搭建数据平台完成各类数据落地、满足各类指标数据展现要求、实现管理驾驶舱展示为主要目标,强调数据平台搭建的科学性、前瞻性,数据来源的准确性和统一性。

江苏金租数据平台系统目前开发完成的主要是管理驾驶舱、经营分析、监管报送、数据采集四大模块。系统业务功能架构见下图:

(1)管理驾驶舱

可根据人员权限灵活展示相应的内容,一共开发了4张PC端、4张手机端报表。主要从投放、资产、人员、渠道等多个方面展示公司的整体情况,同时支持穿透,可以查看某个指标的明细情况;

(2)经营分析

主要用于业务人员在日常工作中的分析报表,以及对外披露报表的展示。例如厂融经销商风险金明细表等157张经营分析报表和厂融经销商风险金收支明细表(对外)等23张对外报表;

(3)监管报送

主要用于满足公司监管报送的需求,目前开发完成的有G1101、G04等66张银保监会报送报表,以及存量单位贷款等10张人民银行基础数据报送报表;

(4)数据采集

主要用于用户补录一些目前在业务系统缺失但是对于经营分析或者监管报送又不可或缺的数据。比如内部行业分类补录、G22日报补录等17张补录报表。

3、价值体现

截止目前,项目在数据库方面一共交付55张ODS层库表、38张DW层库表以及72张维表;数据平台前端交付5张领导驾驶舱、157张经营分析报表、10张数据补录表。自数据平台上线以来用户数已超过400余人,有效地支持公司各大部门的日常工作。为企业带来价值体现如下

(1)提升科技治理水平

数据平台集成了公司大单业务系统、零售业务系统、助融业务系统、财务系统、资金系统、OA系统、HR系统七大系统数据,解决了数据信息孤岛,有利于风险监控和日常管理。

数据平台通过主题模型,将不同系统的同类数据进行抽取、清洗、加工和转换,实现不同系统间同类报表查询、监管报送等工作统一处理,保证数据统一标准,防止形成“蛛网结构”,减少重复开发,节约IT资源和开发成本。

(2)保障公司精细化管理

管理驾驶舱以及穿透页能让公司管理层和业务部门人员及时获知公司和部门经营管理情况,动态调整公司和部门重点工作,更好的指导团队完成各项经营指标。

(3)满足公司多维数据分析需求

通过对历史数据进行详细记录处理,建立多维维度表和指标体系,满足了公司各部门多维度指标分析的需要。

(4)加强信息安全管控

数据平台在门户的开发上实现了一个部门一个门户,并且通过组织架构精确控制查询权限,人员权限可精准控制到具体报表的相关字段,从技术上杜绝了人员能够查询与自己无关的数据信息,并对人员姓名、证件号码等关键信息进行了脱敏处理,防止公司核心信息数据泄露。


随着互联网的快速发展, 互联网+的大规划应用, 工程数据量以几何级数增长, 如何处理这些大量的结构化和非结构化的数据, 显得越来越重要。数据库和数据仓库是互补的, 谁也替代不了谁, 他们将会协同发展, 相互协作为企业服务。

数据库存储的是事务型的日常处理的数据, 解决工程施工、设计、咨询等各方面的需要。数据仓库是面向主题的分析, 为人们提供决策支持需要。两者不一定非要区分本质区别,应用得好才是最主要的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/336180.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FANUC机器人UI[4]_CSTOPI循环停止信号使用时的注意事项

FANUC机器人UI[4]_CSTOPI循环停止信号使用时的注意事项 前面已经和大家介绍了关于FANUC机器人的UOP信号的具体功能,具体可参考以下链接中的内容: FANUC机器人UOP信号(UI+UO)功能详细介绍 本次关于FANUC机器人的UI[4] CSTOPI循环停止信号使用时的注意事项进行一个补充说明。…

C语言-程序环境和预处理(14.2)

目录 预处理详解 1.预定义符号 2. #define 2.1 #define定义标识符 2.2 #define 定义宏 2.3 #define 替换规则 注意事项: 2.4 #和## 2.5 带副作用的宏参数 2.6 宏和函数对比 3. #undef 4. 条件编译 4.1 单分支条件编译 4.2 多分支条件编译 4.3 判断是…

基础篇:01-微服务概述

1.单体应用与微服务架构区别 如上图左侧为单体应用架构。在传统单体应用中,所有功能模块都在一个工程中编码、部署,即使是集群部署,也只是单体应用的水平复制。 如上图右侧为微服务架构。在微服务架构的项目中,每个应用会按照领域…

浅谈保护数据的加密策略

加密是一种将信息从可读格式转换为混乱字符串的技术。这样做可以防止数据传输中的机密数据泄露。文档、文件、消息和所有其他形式的网络通信都可以加密。加密策略和身份验证服务的结合,还能保障企业机密信息只对授权用户开启访问权限。常见的数据加密包括以下两种&a…

定期备份日志并发送至存储服务器指定路径脚本

根据需求编写一个日志定时备份并发送至存储服务器的脚本定期把三天前的日志文件备份,打包发送至日志备份服务器指定目录(修改对应路径拿走即用)vim qingli.sh#!/bin/bash#定义星期几week$(date |awk NR1{print $4})num${week}#日志源目录log&…

Android MVI框架搭建与使用

MVI框架搭建与使用前言正文一、创建项目① 配置AndroidManifest.xml② 配置app的build.gradle二、网络请求① 生成数据类② 接口类③ 网络请求工具类三、意图与状态① 创建意图② 创建状态四、ViewModel① 创建存储库② 创建ViewModel③ 创建ViewModel工厂五、UI① 列表适配器②…

【3D目标检测】基于伪雷达点云的单目3D目标检测方法研宄

目录概述细节基准模型点云置信度生成网络特征聚合 DGCNN概述 本文是基于单目图像的3D目标检测方法,是西安电子科技大学的郭鑫宇学长的硕士学位论文。 【2021】【单目图像的3D目标检测方法】 细节 基准模型 作者还是按照伪雷达点云算法的流程设计的,并…

多传感器融合定位十四-基于图优化的定位方法

多传感器融合定位十四-基于图优化的定位方法1. 基于图优化的定位简介1.1 核心思路1.2 定位流程2. 边缘化原理及应用2.1 边缘化原理2.2 从滤波角度理解边缘化3. 基于kitti的实现原理3.1 基于地图定位的滑动窗口模型3.2 边缘化过程4. lio-mapping 介绍4.1 核心思想4.2 具体流程4.…

lamada表达式、stream、collect整理

lamada表达式格式 格式:( parameter-list ) -> { expression-or-statements } 实例:简化匿名内部类的写法 原本写法: public class LamadaTest { public static void main(String[] args) { new Thread(new Runnable() { …

基于PYTHON django四川旅游景点推荐系统

摘 要基于四川旅游景点推荐系统的设计与实现是一个专为四川旅游景点为用户打造的旅游网站。该课题基于网站比较流行的Python 语言系统架构,B/S三层结构模式,通过Maven项目管理工具进行Jar包版本的控制。本系统用户可以发布个人游记,查看景点使用户达到良…

树莓派安装虚拟键盘matchbox-keyboard,解决虚拟键盘乱码问题,解决MIPI DSI触摸屏触控漂移问题

安装虚拟键盘,解决乱码问题 当我们买了触摸屏后,会发现没有键盘,还是无法输入,因此需要虚拟键盘 如果你的语言和地区是中文,那么安装虚拟键盘后可能显示乱码,所以还需要安装中文字体 sudo apt install ttf…

音视频开发—FFMpeg编码解码

FFMpeg 作为音视频领域的开源工具,它几乎可以实现所有针对音视频的处理,本文主要利用 FFMpeg 官方提供的 SDK 实现音视频最简单的几个实例:编码、解码、封装、解封装、转码、缩放以及添加水印。 接下来会由发现问题->分…

Elasticsearch5.5.1 自定义评分插件开发

文本相似度插件开发,本文基于Elasticsearch5.5.1,Kibana5.5.1 下载地址为: Past Releases of Elastic Stack Software | Elastic 本地启动两个服务后,localhost:5601打开Kibana界面,点击devTools,效果图…

koa ts kick off 搭建项目的基本架子

koa ts kick off 使用ts开发koa项目的基本架子,便于平时随手调研一些技术 项目结构 ├── src │ ├── controller //controller层 │ ├── service //service层 │ ├── routes.ts //路由 │ └── index.ts //项目入…

【图像配准】多图配准/不同特征提取算法/匹配器比较测试

前言 本文首先完成之前专栏前置博文未完成的多图配准拼接任务&#xff0c;其次对不同特征提取器/匹配器效率进行进一步实验探究。 各类算法原理简述 看到有博文[1]指出&#xff0c;在速度方面SIFT<SURF<BRISK<FREAK<ORB&#xff0c;在对有较大模糊的图像配准时&…

04 react css上下浮动动画效果

react css上下浮动动画效果html原生实现上下浮动react 实现上下浮动思路分析实现步骤1.引入useRef2.在所属组件内定义—个变量3.在按钮上添加事件4.定义点击事件对window.scrollTo()进行了解&#xff1a;在react中实现效果图&#xff1a;html原生实现上下浮动 我们有一个导向箭…

【分享】订阅金蝶KIS集简云连接器同步OA付款审批数据至金蝶KIS

方案简介 集简云基于钉钉连接平台完成与钉钉的深度融合&#xff0c;实现钉钉OA审批与数百款办公应用软件&#xff08;如金蝶KIS、用友等&#xff09;的数据互通&#xff0c;让钉钉的OA审批流程与企业内部应用软件的采购、付款、报销、收款、人事管理、售后工单、立项申请等环节…

【2023面试秘籍】 测试工程师的简历该怎么写?

作为软件测试的垂直领域深耕者&#xff0c;面试或者被面试都是常有的事&#xff0c;可是不管是啥&#xff0c;总和简历有着理不清的关系&#xff0c;面试官要通过简历了解面试者的基本信息、过往经历等&#xff0c;面试者希望通过简历把自己最好的一面体现给面试官&#xff0c;…

【Java 面试合集】重写以及重载有什么区别能简单说说嘛

重写以及重载有什么区别能简单说说嘛 前述 这是一道非常基础的面试题&#xff0c;我们在回答的过程中一定要逐一横向比较。 从方法的 修饰符&#xff0c;返回值&#xff0c;方法名&#xff0c;含义&#xff0c;参数等方面进行逐一分析来比较不同。 话不多话&#xff0c;看下…

什么样的台灯适合学生做作业的?开学季,适合孩子写作业的台灯

学生在做作业时&#xff0c;是离不开台灯的&#xff0c;在台灯下学习三四个小时&#xff0c;如果台灯质量不好&#xff0c;那对视力造成很大影响&#xff0c;研究表明&#xff0c;儿童在过亮或者过暗的环境中长时间学习&#xff0c;会导致视力下降等&#xff0c;那么什么样的台…