数字化转型中,企业如何做系统设计

news2024/12/28 20:24:59

随着人工智能、大数据、云计算、区块链等新一代信息化、数字化技术的高速发展,现阶段社会的方方面面都已经有了巨大的改变,各行各业的企业也都开始了新一轮的科技革命和产业革命,可以说是互联网时代之后,又一个能够从各方面影响世界发展的新的时代。

系统设计包含总体设计、数据设计及平台设计。

1、总体设计(数据架构、平台架构和研发规范)第一阶段的规划工作完成后,进入总体的架构设计阶段。由阿里巴巴提出的 OneData 的核心思想是统一数据主体、统一数据建模、统一数据服务以及一系列的数据管理体系。在设计阶段,可以参考这几个方面进行考虑与架构。

(1)数据架构数据中台的数据架构设计是基于需求调研阶段的业务需求、数据情况,完成数据中台概要设计工作。数据架构设计主要包含 OneModel 、OneID 和 OneService 。

OneData数据中台就是要在整个企业中形成一个公共数据层,实现数据的复用,所以强调数据只加工一次,不会因为不同的应用场景造成数据重复加工。如何实现:数据划分主题进行管理:表的命名,字段的命名等规范统一,做到见名知义数据格式和字段命名和定义规范化:具体参考离线数仓项目讲解的表和字段命名规范:数仓分层-业务主题域-业务过程-基础信息-分区规则指标一致:提供全局数据字典确保意义一致。数据模型复用:推荐采用分层的设计方式,通常包括:ODS,DWD,DWS,ADS / DM,DIM。

数据完善:数据中台尽可能的覆盖到所有业务过程,用户和系统的一切行为都被记录下来永久保存OneData 体系的目标是构建统一的数据规范标准,让数据成为一种资产,而不是成本。OneModel 可分为以下四部分。

业务板块:根据业务的特点和需求将相对独立的业务划分成不同的业务板块,不同业务板块之间的指标或业务重叠度较低。数据域是指面向业务分析,将业务过程或者维度进行抽象的集合。

数据域划分上,需要从三个方面进行考虑。

  1. 全局性:站在企业高度上,保障良好的扩展性和稳定性。
  2. 数量适中:根据业务情况,划分的粒度要粗细合适,通常在 5~15 个。
  3. 可理解:站在业务的角度上,确保划分便于理解,不产生歧义。在划分数据域时,既要涵盖当前所有业务的需求,也要考虑有新业务的弹性扩展。

总线矩阵:在进行了充分的业务调研和需求调研后,就要构建总线矩阵了。总线矩阵由业务处理过程和维度组成一个二维表格。在行为不同的业务处理过程与维度的交叉点上打上标记,表示该业务处理过程与该维度相关。

数据分层:数据模型以维度建模理论为基础,建设数据中台的公共数据层。一般将数据模型划分为操作数据层(ODS)、通用数据模型层(CDM)和应用数据层(ADS)。

2、OneID 功能包含以下四部分。

OneID 配置:主要根据具体的业务需求,完成数据源表、ID 映射表、歧义规则表的设置工作。

OneID 数据处理:主要通过数据源表和 ID 映射表等配置表单完成原始数据的数据拉取和清洗等操作,生成基础数据。

OneID 规则计算:主要利用图计算框架完成关键连接点的搜索和歧义数据的图连通工作,并根据配置的规则对图数据进行切割,从而唯一确定一个实体的身份信息,生成 OneID。

OneID 数据存储和展示:主要完成 OneID 图数据存储和展示,以及最后生成的 OneID 清单数据存储等。

OneService 统一数据服务OneService 包括以下功能模块:服务单元设计、API 设计、API 审核和 API 运营。服务单元设计是指将单个或多个物理表配置成一个视图。基于配置好的服务单元,通过简单可视化界面或 SQL 脚本,设计 API 的请求参数和返回参数。API 设计好后,将其发布至服务市场供使用者调用。API 在被使用前,需要经过申请审批。被使用的 API 需要运维及监控,包括平均响应时长、调用次数、错误率等指标的监控,还可以配置 API 的告警及限流措施等。

(2)平台架构结合前期调研的业务需求和数据现状,从宏观层面规划出数据中台的各个模块、各个功能部件所用到的技术总体架构图。

采集架构:数据采集打通各种数据来源,为数据中台提供待分析和处理的数据,主要分为实时和离线数据采集。

存储架构:整个存储架构包含原始数据源存储技术、数据源接入技术、数据中台数据存储与计算技术、数据服务及数据应用技术。

数据流:从业务数据进入数据采集通道,到进入数据中台在各个加工任务中流转,再到数据对外服务的这个过程,需要进行哪些存储、哪些技术处理等,这些步骤需要在设计时就以数据流向用流程图的形式画出。

网络架构:数据中台涉及与多方的源系统进行数据交互,而网络设计对于后续数据同步、接口调用等有较大影响。

部署架构:这部分设计主要涉及数据中台的研发平台与应用软件。需包含整体的部署方案。

安全架构:主要包含研发平台的用户角色权限控制方案、开发与生产环境隔离方案、数据安全方案。

(3)数据模型设计规范与标准良好的数据模型可方便、有效地组织数据中台中存储的企业数据资产,所以数据模型的设计工作有必要遵循一定的规范和约束。

2. 数据设计 (数据集成、模型设计和服务详设)数据设计包括数据集成、模型设计和服务详设,

数据集成数据集成需要解决不同源系统数据异构性问题。结构化数据一般以二维形式存储在关系型数据库中,对于这种数据类型,数据集成有 3 种方式。直连同步:通过规范的 API(如 JDBC)直接连接业务库。但是业务库直连的方式对源系统的性能影响较大,当执行大批量数据同步时会降低甚至拖垮业务系统的性能,此种抽取方式性能较差,不太建议使用。

数据文件同步:通过约定好的文件编码、大小、格式等,直接从源系统生成数据的文件,由专门的文件服务器加载到数据中台。但由于要保证数据文件的完整性,通常除数据文件外,还需要上传校验文件,供下游系统做数据校验。

数据库日志解析同步:这种方式实现了实时与准实时同步,延迟可以控制在毫秒级别,并且对业务系统的性能影响比较小,目前应用较为广泛。除了数据读取的方式,还可按数据量来分解数据集成策略。

小数据量同步:数据记录小于 10 万条的源表建议每日全量更新,写入全量分区表。全量分区表可按天创建。可根据业务需要设置数据的生命周期,并定时清理。

大数据量同步:数据记录大于 10 万条的源表通过时间戳抽取增量数据到增量分区表。增量分区表可设置长周期,根据需要设置冷、温、热数据区。非结构化数据一般没有固定的结构,各种文档、图片、视频、音频等都属于非结构化数据。对于这类数据,数据集成策略通常是直接整体存储,而且一般存储为二进制的数据格式。除了结构化数据和非结构化数据,还有半结构化数据,常见的数据格式有 JSON 和 XML。对于半结构化数据,数据集成策略同样可以是直接整体存储。但随着数据技术的发展,NoSQL 数据库已经可以很好地支持半结构化数据的存储。

免责声明:本公众号所发布的文章为本公众号原创,或者是在网络搜索到的优秀文章进行的编辑整理,文章版权归原作者所有,仅供读者朋友们学习、参考。对于分享的非原创文章,有些因为无法找到真正来源,如果标错来源或者对于文章中所使用的图片、链接等所包含但不限于软件、资料等,如有侵权,请直接联系后台,说明具体的文章,后台会尽快删除。给您带来的不便,深表歉意。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/745636.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL物理文件----日志文件(错误日志、通用查询日志、二进制日志、慢查询日志)

文章目录 MYSQL5.7/8.0支持的几种日志文件1、错误日志(Error log)2、一般或通用查询日志(General query log)3、二进制日志(Binary log)3、1 查看是否开启二进制日志3、2二进制日志开启3、3查看二进制文件位…

数据结构05:树与二叉树[C++][并查集]

图源:文心一言 Chat GPT生成,代码的核心思想与王道咸鱼老师的视频虽然类似,但是在具体实现上毕竟还是略有差别~~因此,如果对考研方向的并查集代码感兴趣,可以查看—— 王道咸鱼老师的视频:{5.5_2_并查集_…

会议邀请|思腾合力邀您共赴MICS 2023第十届医学图像计算青年研讨会

医学图像计算青年研讨会 (Medical Imaging Computing Seminar, MICS) 于2014年成立,宗旨是为医学影像分析领域的全球华人学者提供学术交流平台,增进本领域科研人员和医学专家的交流和合作。 第十届医学图像计算青年研讨会 (MICS 2023) 将于2023年7月14-1…

form表单禁止浏览器自动填充密码

因为用户修改密码的时候,谷歌浏览器、edge等浏览器,总是自动将保存的密码填充到重置密码输入框中,给用户使用带来困扰。原因是因为你在登录的时候选择记住了账号和密码了,所以就会把信息存在浏览器里面,当你在修改密码的时候,由于form表单的 type="password" 所…

【Arduino小车实践】PID算法简介

一、介绍 1. 特点 流量稳定、改变流量(水阀):测量当前流量,与预期流量进行比对,不相等则进行相应的调整。 2. 适用系统 适用线性系统(二阶以内的线性系统):齐次性、叠加性 3. 宏…

ASEMI-A7二极管可用什么代替,M7二极管正负极判断

编辑-Z 在电子设备的世界中,二极管是最常见的组件之一。它们在各种设备中发挥着重要的作用,包括电源适配器、电源供应器、电池充电器等。在这篇文章中,我们将探讨A7二极管可用什么代替,以及M7二极管正负极判断。 首先&#xff0c…

解决Vue 报错error:0308010C:digital envelope routines::unsupported问题

解决Vue 报错error:0308010C:digital envelope routines::unsupported问题 问题原因方法一:修改配置方法二:尝试卸载Node.js 17版本并重新安装Node.js 16版本,然后再重新启动方法三:package.json增加配置(大多数解决问…

【自动驾驶汽车量子群粒子过滤器】用于无人驾驶汽车列车定位的量子粒子滤波研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

Doris单机安装部署

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、前期准备1.下载安装包2.修改limits文件 二、安装1.配置启动FE2.配置启动BE3.web测试4.连接测试、添加BE 结尾 前言 Apache Doris 是一个基于 MPP 架构的高…

Linux搭建PXE服务器

安装PXE启动服务器所需的软件包 Tftp,dhcp和vsftpd(httpd也可以作为安装源) 编辑TFTP配置文件 重启tftp服务 编辑/etc/dhcp/dhcpd.conf,新建作用域,主要设置下一跳服务器地址和引导文件名称。 重启dhcp服务 把centos光盘内容拷贝…

营销本地化,跨境电商都要懂的行业知识

营销本地化是调整营销内容以满足目标市场的文化、语言和其他相关差异的过程,这对于那些希望在全球市场取得成功的企业至关重要。它可以帮助公司与客户建立有意义的联系,并提供优质的客户体验。随着技术和互联网的进步,企业可以获得大量资源、…

基于单片机的厨房安全监测系统的设计与实现

功能介绍 以STM32/51单片机作为主控系统; OLED液晶显示当前检测的气体浓度,温度,是否有火等信息; 按键可以设置温度上限、可燃气体浓度上限; 当温度超过我们设置自动开启风扇进行降温; 当检测到天然气泄露后…

【误差自适应跟踪方法AUV】自适应跟踪(EAT)方法研究(Matlab代码Simulin实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

使用wireshark抓包,验证feign http请求的数据透传结果

一、背景 在灰度部署、A/B测试、单元化部署等场景下,微服务服务之间的调用,要求我们对上游服务给过来的数据进行透传至下游服务。 如果是灰度部署,需要对http请求进行染色,http header头部增加灰度标识,然后传递给下…

掌握std::move和std::forward

在讲解std::move和std::forward之前,我们必须先了解C中左值、右值的相关概念。 1、左值、右值 (1)左值:一般指的是在内存中有对应的存储单元的值,最常见的就是程序中创建的变量。 (2)右值&…

热泵空调渗透率超10%,哪三家本土供应商领跑市场

作为新能源汽车产业链的潜在高增长赛道,以及整车热管理系统的关键组成部分,车用热泵空调市场近年来呈现快速发展的态势。 而从新能源整车热管理角度来看,通过制冷及热泵技术的完善,发展低碳的热管理技术,从而提升热管…

基于Hadoop生态实现离线与实时的消费者商品交易行为分析(消费行为分析、购买偏好分析)

项目背景 大数据专业综合项目实践,数据集采用阿里天池的公开数据集,下载链接: 消费者商品交易调研清单 这个数据集是一个样本集,共有5000多条记录,每条记录代表一个消费者的商品交易调研信息。以下是对每个字段的描述&#xff1a…

什么是卷积神经网络——CNN

卷积神经网络(CNN) PS: 卷积神经网络 主要包括:输入层、卷积层、池化层、全连接层 1. 卷积神经网络结构介绍 如果用全连接神经网络处理大尺寸图像具有三个明显的缺点: (1)首先将图像展开为向量会丢失空间信息&…

【C#】Kestrel和IIS服务器下的同步与异步配置

最近在回看自己写的代码时,发现服务配置里最开头写了两段代码,第一感觉,这是啥功能,太久有点生疏了,经过一顿搜索和回顾,简单整理如下 目录 1、Kestrel服务器1.1、跨平台1.2、高性能1.3、可扩展性1.4、安全…

Hadoop 3.2.4 本机伪分布式安装

Hadoop 3.2.4 伪分布式安装 文章目录 Hadoop 3.2.4 伪分布式安装前言配置ssh免密登录下载安装包解压并调整配置文件解压安装包到当前位置调整配置文件hadoop-env.shyarn-env.shcore-site.xmlhdfs-site.xmlmapred-site.xmlyarn-site.xmlworkers 配置 启动验证启动与命令查验web页…