集团企业大数据治理解决方案word

news2024/9/21 4:28:37

第一章 集团企业大数据治理阶段目标

通过数据平台和BI应用建设,集团企业大数据将搭建统一的大数据共享和分析平台,对各类业务进行前瞻性预测及分析,为集团企业各层次用户提供统一的决策分析支持,提升数据共享与流转能力。

dd41b1b19370f592b69bd4dd6cc090b1.jpeg

一.1、 数据平台逻辑架构

c3b1d53efeb53854a6f87e73f693b367.jpeg

一.2、 数据平台部署架构

8e1b161e824efe2658252b3f4fc93bde.jpeg

一.1、 建设目标

以大数据项目建设作为契机,凝聚集团优势力量,全面梳理数据资源,完善数据体系架构,自主掌握大数据关键技术,加速大数据资源的开发利用,将数据决策化贯穿到经营管理全流程,建设集团企业,提升核心竞争力。

一.1.1、 建设大数据基础设施,完善全行数据体系架构

构建大数据平台,实现更广泛的半结构化、非结构化数据集中采集、存储、加工、分析和应用,极大地丰富集团的信息资源,同现有的企业级数据仓库和历史数据存储系统一起,形成基础数据体系,提供支撑经营管理的各类数据应用。

一.2.1、 开发大数据资源,支撑全行经营管理创新

建设离线数据分析、实时数据/流数据分析集群和各类数据分析集市,提供高性能可扩展的分布式计算引擎,通过数据挖掘、计量分析和机器学习等手段,对丰富的大数据资源进行开发使用,并将数据决策化过程结合到风控、营销、营运等经营管理活动。

一.2.2、 培养大数据人才队伍,建立大数据分析能力

结合大数据项目的落地实施,建立起一支大数据技术和分析人员队伍,具备自主运营和开发大数据的能力,以更好推动业务创新,提升集团核心竞争力。

一.3、 数据治理目标

一.3.1、 发现数据质量问题,推动大数据治理工作的开展,建立数据质量检核系统

Ø 对源系统进行数据质量检核,发现数据质量问题并统计影响到的报表

Ø 对数据质量问题进行归类总结,分析成因和改进建议

Ø 建设数据质量检核系统

一.3.2、 分析、梳理业务系统,推动数据标准的建立,统一全行口径

Ø 建立基础标准和指标标准框架

Ø 确定标准化范围,对重要属性进行标准化

一.3.3、 建立数据仓库模型框架,优化集团数据架构,建设稳定、可扩展的数据仓库

Ø 引进业内具有先进水平的金融数据模型,进行客户化改造后,建成符合某行特点的数据仓库模型框架

Ø 覆盖某行主要业务系统数据,以便快速高效的为应用系统提供数据

Ø 存储历史数据,解决新报表上线才有数的问题。

Ø 汇总层建设(共性加工)

一.4、 目标建设方法

一.4.1、 建设内容

分析源系统表数据,从及时性、完整性、准确性、有效性、一致性方面对源系统数据进行数据校验,发现并记录数据质量问题,生成数据质量问题报告。

建设数据质量检核系统,对源系统基础业务数据的进行全面的数据质量检查,并实现重要业务数据质量的周期性动态检查,对发现的数据质量问题生成数据质量报告,反馈给业务部门。

一.1、 集团企业大数据平台应用架构

de576b47191f202802680274fd268ad2.jpeg

一.2、 集团企业大数据平台架构

1727f5b9cd82b1b08b2446418c45a871.jpeg

一.3、 集团企业大数据支撑平台

一.3.1、 大数据虚拟化平台

大数据虚拟化平台采用虚拟化技术,以充分利用计算、存储、网络等资源,同时采用数据备份方案以增加可靠性。可以实现:

1.效率大幅度提高

由于将资源池化管理和使用,资源得到充分利用。采用分权分域运维的方式,运维更加有效。

2.更低能耗

更加节能,基础设施与IT设备联动节能、负荷均衡。

3.优化业务

新业务上线周期大幅度缩短。可以为各单位提供更多业务:IAAS、PAAS、SAAS,等等。

4.提高效益

在区级单位建立虚拟化平台,其他各单位不需要建立维护自己的基础设施,利用区大数据虚拟化平台运行各自应用。投资收益率,大幅提升,TCO大幅度降低。

一.3.1.1、 设计原则

1.统一的虚拟化平台

采用虚拟化管理软件,将计算资源划分为多个虚拟机资源,为用户提供高性能、可运营、可管理的虚拟机。支持虚拟机资源按需分配。支持多操作系统。保证资源合理分配,隔离用户间影响。本项目中,为新开发业务系统、迁移业务系统、数据交换与共享前置机分配虚拟机。

2.统一的资源管理

统一资源池,屏蔽不同硬件差异,资源的更换升级对用户零感知。统一管理平台,支持业界主流的操作系统,兼容现有计算及存储资源。设备自动发现,资源快速发放,缩短业务上线时间。

3.支持多种硬件设备

支持多种服务器和兼容多种存储设备,可供用户灵活选择。

4.自动化调度

支持自定义的资源管理策略、故障判断标准及恢复策略。通过资源调度、热管理、能耗管理等一体化拉通,降低维护成本。自动检测服务器或业务的负载情况,对资源进行智能调度,均衡各服务器及业务系统负载,保证系统良好的用户体验和业务系统的最佳响应。

5.完善的权限管理

根据不同的角色、权限等,提供完善的权限管理功能,授权用户对系统内容的资源进行管理。

6.应用智能管理

支持服务目录,应用快速部署。灵活的模板机制,支持用户自定义模板。

7.精细化计费

针对不同的业务类型,进行精确计费。按IT资源(CPU、内存、存储)用量计费。按时计费。

8.丰富的运维管理,实现业务的可控、可管,使整个系统有效运营。

支持快速故障定位,系统通过获取异常日志和程序堆栈等方法,缩短问题定位时间,快速解决异常问题。系统通过自动化的健康状态检查,及时发现故障并预警,确保虚拟机可运营管理。支持全Web化的界面,通过Web浏览器对所有硬件资源、虚拟资源、用户业务发放等进行监控管理。

9.安全

采用多种安全措施和策略,并遵从信息安全法律法规,对用户接入、管理维护、数据、网络、虚拟化等提供端到端的业务保护。

一.3.1.2、 虚拟化平台设计

9bd3e2832dccc0bf6a5e6b76849ff526.jpeg

图5.22虚拟化平台架构

如图所示为虚拟化平台的架构,主要包括五个部分:硬件基础设施、虚拟化存储、虚拟化计算、平台管理、数据存储系统五个部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/432128.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis持久化的几种方式

Redis 持久化也是 Redis 和 Memcached 的主要区别之一,因为 Memcached 是不具备持久化功能的。 1.持久化的几种方式 Redis 持久化拥有以下三种方式: 快照方式(RDB, Redis DataBase)将某一个时刻的内存数据,以二进制的…

SpringAOP入门基础银行转账实例(进阶版)------------事务处理

SpringAOP入门基础银行转账实例**(进阶版)**------------事务处理 由上一节讲述的通过Connection和QueryRunner对事务进行的处理(详情可以去我之前写的博客文章:https://blog.csdn.net/m0_56245143/article/details/130069160?spm1001.2014…

派盘为您的个人数据安家

现如今,我们的生活中有着各种各样的数据。在工作中会有各种文件、邮件;在生活中则有照片和视频等。数据的来源多,时间点不一致且混乱。 数据是否能安全、稳定、长久的存储以及便捷高效的使用对我们来说相当重要。你是否经常出差需要带上电脑或者移动硬盘,想存网盘又怕丢失或…

牛客网:HJ1 字符串最后一个单词的长度

题目部分: 解题思路: 方案一: 对于本题,看似简单,其实有坑。 就是在获取单词这块,不能直接用cin这样子操作,否则不能获取到完整的单词,因为cin这样的读到空格就不会往后续读了&…

elsticsearch与关系数据库的区别

查看所有索引(表) 向索引(表)中添加数据: 自定义id添加数据: 自定义id添加数据:方式二

Android12之网络共存

一.思路 所谓共存就是让两个网络同时使用,如果想让哪个网络作为外网,则该网络优先级要高于内网的网络,即可达到外网用来上网的需求,那么要想共存,就必须到从低优先级网络切换到优先级高的网络时,不要做断开操作,即可达到,两个网络同时存在的需求,做到以上两点,我们便…

MiniGPT4,开源了

简介 MiniGPT-4 旨在将来自预训练视觉编码器的视觉信息与先进的大型语言模型 (LLM) 对齐。 具体来说,在文本方面,作者利用 Vicuna 作为语言解码器,在视觉感知方面,使用了与BLIP-2相同的视觉编码器,并且语言和视觉模型…

数据结构(C语言实现)——二叉树的概念及二叉树顺序结构和链式结构的实现(堆排序+TOP-K问题+链式二叉树相关操作)

文章目录1. 前言2. 树的概念及结构2.1 树的概念2.2 树的相关概念2.3 树的表示3. 二叉树的概念3.1 特殊二叉树3.2 二叉树的性质4. 二叉树的顺序存储4.1 堆的概念4.2 堆的实现4.2.1 堆的结点定义4.2.2 堆的打印和销毁4.2.3 堆的插入4.2.4 堆的删除4.2.5 取堆顶数据4.2.6 堆的判空…

【Python学习笔记】cs231nPython Numpy教程

【Python学习笔记】cs231nPython Numpy教程 回顾经典教程cs231n,完成assignments觉得很困难,感觉自己python基础语法掌握的不是很熟,就顺藤摸瓜找了cs231n他们的官方Python个Numpy教程 如果对英文原版上手有困难,可以看这个&…

智慧园区水电监测系统

随着人们对环保意识的提高,智慧园区的建设也越来越受到关注。其中,水电监测系统是智慧园区的一个重要组成部分。本文将从以下几个方面介绍智慧园区水电监测系统的特点和优势。 一、智慧园区水电监测系统的特点 1.实时监测:智慧园区水电监测系…

某医院网络故障分析案例

1、背景 某市第一医院用户反馈,近期内部业务系统出现访问慢的情况,这种情况严重影响到用户的体验和工作效率。 针对此问题,我们通过NetInside流量分析系统,提供实时和历史原始流量。重点针对网络异常流量跟踪分析,找…

go数据结构(二叉树的遍历)

用数组来存储二叉树如何遍历的呢? 如果父节点的数组下表是i,那么它的左孩子就是i * 2 1,右孩子就是 i * 2 2。 二叉树的遍历方式: 二叉树有三种基本遍历方式,分别是前序遍历、中序遍历和后序遍历。遍历的原理是从根…

Jenkins 流水线

采用Jenkins的自由风格构建的项目,适合用于测试和学习,主要问题有: 构建过程中整体流程是不可见的,无法确认每个流程花费的时间出现问题不方便快速的定位无法进行版本化管理多个任务中有很多步骤需要重复搭建 Jenkins的Pipeline…

MYSQL Row 752 was cut by GROUP_CONCAT()

因为group_concat有个最大长度的限制,GROUP_CONCAT函数返回的结果大小被MySQL默认限制为1024(字节)的长度。超过最大长度就会被截断掉 解决方法:更改配置文件,修改长度。 https://blog.csdn.net/zzddada/article/details/115082236 concat…

DHCP与RIP配置实验

目录 一、实验要求与拓扑结构 1、实验要求 2、提前规划好网段的拓扑结构如下图 二、实验步骤 1、给每台路由器的各个接口配置ip 2、给路由器AR1和AR3配置dhcp服务 3、在路由器AR1和AR2上运行ripv2,在AR3上运行ripv1 4、更改接口的rip协议版本 一、实验要求与…

chatglm-6b模型在windows的详细安装教程

1.先是看了github的文章(如果打不开这篇文章,可能需要科学上网,即访问外网的VPN): https://github.com/THUDM/ChatGLM-6B 2.准备:台式机,GPU是8G。(关于是否可以在笔记本运行&#x…

【网路】-- HTTP协议

目录 HTTP协议 认识URL urlencode和urldecode Http http的宏观结构 http请求报文格式 http响应报文格式 HTTP的方法 表单 重定向 HTTP常见Header 会话管理 Cookie 实验证明 Connection选项 工具推荐 Fiddler 原理 应用层:就是程序员基于socket接口…

如何在大厂做好架构演进?

1 架构演进的定义 1.1 定义 通过设计新的系统架构(4R),来应对业务和技术的发展变化。 1.2 关键点 新架构新的复杂度 1.3 目的 应对业务和技术的发展变化后带来新的复杂度。 案例 淘宝去IOE,是因为业务发展大了后,IOE的成本和可控性难…

51单片机入门

文章目录 一、安装keil5及proteus二、MCS-51单片机结构与原理(一).8051单片机基本组成(二).8051单片机引脚1.电源引脚2.时钟电路引脚3.控制信号引脚4.输入/输出端口 (三) 并行输入/输出端口结构 三、单片机cx51编程基础(一).变量定义(二).数据类型(三).存储类型(四).Cx51语言程…

【Python】逆向解析js代码

目录 1. 打开百度翻译网页,查找翻译结果的网络资源包 2. 获取翻译结果网络资源包的url、请求头、请求体,解析json文件数据 3. 观察请求体字段,发现 query 字段便是我们输入的需要翻译的值 4. ctrl F 快捷键搜索sign值的网络资源包&#x…