数据中台 | 数据智能平台产品系列文章,企业开发和盘活数据资产的利器!(上篇)

news2024/9/20 16:06:11

引言

发展数字经济,实现数字中国是我国的国家战略,坚定且不可动摇,近期随着《数据二十条》、《“数据要素×”三年行动计划》、《关于加强数据资产管理的指导意见》等重磅政策的发布,使数字化转型成为越来越多企业增强竞争、扩大营收的必选项。特别是《企业数据资源相关会计处理暂行规定》正式稿的发布和数据资产入表的正式实行,为数字经济提供了更为切实可行的切入点。

随着国家政策和指导意见的不断推出,以及政府、企业对数据要素市场和数据资产入表探索的不断深入,我们可以看到企业对于数据资产及其背后价值实现和变现的需求。

为了跟上市场的脚步,满足用户现阶段需求,我们重新梳理了产品体系,推出升级的2.0版本产品,可以向客户输出数据的采集和存储数据治理数据价值开发数据应用开发、数资登记运营、数资价值评估数据资产开发六大全域核心能力。同时,围绕我们提供的核心能力,我们会开启数据智能平台系列文章的持续更新,包含六大核心能力领域的知识科普、产品&方案介绍、技术对比&选型、设计与开发要点等知识和经验的分享,满满都是干货,还请您一定要狠狠地期待一下!

本篇是系列文章的第一篇,小兵先为您介绍数据智能平台的前三大能力:数据采集和存储数据治理数据价值开发

图片

01 战略背景

1.1 国家战略

发展数字经济,强化数据基础设施是我国的国家战略,党的十九大报告对建设网络强国、数字中国、智慧社会作出战略部署。实施国家大数据战略,大力发展数字经济,以信息化培育新动能,用新动能推动新发展。

1.2 政策背景

各类国家、省市、地方出台的政策、指导意见、工作指南、成功案例集以井喷式不断发布,并引发业界对数据要素X、新质生产力、数据资产入表等新理念的研讨热潮。

国家“十四五”相关规划,强调数据要素战略层面部署

  • 2021年12月  国务院《“十四五”数字经济发展规划》

  • 2021年11月 工信部《“十四五”大数据产业发展规划》

中共中央 国务院,构建数据基础制度,数据要素市场化

  • 2020年4月《关于构建更加完善的要素市场化配置体制机制的意见》

  • 2022年12月 中共中央 国务院《关于构建数据基础制度更好发挥数据要素作用的意见》

财政部,首次提出企业数据资产入表相关处理

  • 2023年8月《企业数据资源相关会计处理暂行规定》(以下简称《暂行规定》)

  • 2024年1月1日起正式施行《暂行规定》

小兵认为其中对数字经济发展推动效果最明显的,还是财政部于2023年8月正式发布,2024年1月1日正式施行的《企业数据资源相关会计处理暂行规定》。在此之前,众多企业虽关注数据资产,但因短期见不到收益,很多企业不愿意进行数据的采集、存储和管理。

图片

02 需求痛点

无论是政府还是企业,都会面临如下问题:

1.面对海量、多源、异构数据如何去采集和存储的问题;

2.如何对采集和存储的数据进行治理,以保证数据的标准性和规范性;

3.如何对数据进行分析和挖掘,形成有价值的数据产品(算法、模型、API...)

4.企业数据来自内部的各个部门,需要对各个部门的数据进行梳理和登记,并做好数据运营;

5.要对登记的数据资产进行规模、质量、价值等多维度评估,实现数据资产入表。

图片

03 产品介绍

3.1 产品定位

打造全域数据管理能力中心,旨在为用户提供数据资产采集存储、数据综合治理、数据价值开发、数据应用开发、数据资产登记运营、数据资产评估入表等全链路的一站式产品 + 技术 + 方法论服务,构建面向数据价值挖掘、应用的数据智能平台。

3.2 整体架构

图片

3.3 技术架构

图片

数据共享:主要采用Spring Cloud、Sprin Boot等前端技术;

数据存储:采用多源异构的存储架构,支持MYSQL、MongoDB、HIVE、HBase、ES、Redis等关系型数据库和大数据组件;

数据计算:基于hadoop、spark去做这种大数据的计算,通过Flink进行流式计算。基于PyTorch框架和TensorFlow的机器学习能力。

数据采集:支持多种类型的数据采集方式,包括API、MQ、Kafka、ETL/Kettle、HTTP等

3.4 数据采集&存储

提供可视化的数据采集图形界面,支持以标准化、模块化的方式进行多源异构数据资源的接入,并支持将采集的数据存储到数据仓库。

图片

  • 数据源:

支持多种类型和存储方式的数据源采集

数据类型:结构化数据、非结构化数据、半结构化数据、日志数据、流失数据;

存储方式:MySQL、MongoDB、HIVE、HBase、ES、Redis。

  • 数据采集:

支持数据表集成、API集成、Excel集成、ETL集成、实时数据(Kafka)集成等多种数据采集方式。

  • 数据存储:

支持将采集的数据存入数据仓库,并支持自定义分层和数据编目。

3.5 数据综合治理

数据综合治理模块融合元数据管理、数据标准管理、数据质量管理、主数据管理等产品功能,各产品功能可独立或任意组合使用,打通数据治理各个环节,快速满足政府、企业各类不同的数据治理场景。在数据接入和数据挖掘环节,数据智能平台也支持对数据进行相应的清洗和治理,实现全链条的数据治理能力。

图片

  • 数据标准:根据制定的数据智能平台、各数据来源方基础数据,业务数据的数据标准,统一管理数据标准,规范数据资源格式、命名的准确性和口径的一致性,数据标准管理包含标准生成、标准映射、变更查询、映射查询、维护标准、标准版本查询、标准导出等功能。

  • 元数据管理:元数据管理是数据治理得到有效实施的关键技术环节之一,可以帮助用户快速定位和理解数据;为数据血缘分析、追踪溯源、数据资产管理等提供元数据支撑。包含数据源管理、元数据管理、数据分析、数据检索、数据地图、数据标准治理、SQL工作台等功能。

  • 数据质量管理:数据质量通过建立评估标准和管理规范,提供数据质量问题统计、质量报告、日志监控、规则配置等闭环流程和管理功能, 为数据质量提供必要的保障。

  • 主数据管理:用于协调和管理企业内用于识别关键业务实体(如客户、产品、供应商和员工)的一致性、准确性和统一性的数据。主数据管理的目的是创建一个“单一真相源”,确保在不同部门和系统之间共享的数据保持一致,从而提高数据质量、减少数据冗余,并支持更好的业务决策。包括主数据配置、主题数据抽取、关系分析、索引创建等功能。

3.6 数据价值开发

利用算法、模型、机器学习等技术,对用户采集的不同的数据进行分析挖掘,形成有价值的数据产品,包括数数据集、算法、模型、API接口、数据报表等,主要包含模型工厂、应用超市、任务中心、算子组件等功能。

图片

  • 模型工厂:提供模型分类、模型管理、模型设计等功能,在定义模型的时候,每个结果集都是可视化展示,并可对结果集进行自定义可视化布局,两两结果集都可以根据逻辑函数碰撞分析。定义完的模型,可以一键发布到应用超市中。

  • 任务中心:提供任务统一管理系统的定时任务,提供任务创建、删除、时间管理、执行、暂停、日志查看功能;模型任务监控:监控定时运行的模型后台任务执行情况;应用任务监控:监控用户发起的应用调用任务执行情况。

  • 应用超市:提供模型转化发布应用,以APP的方式上架到应用超市中,供用户自主选择所需服务过程的能力。

  • 算子组件: 提供图形化选择的各类算子组件,包括过滤、交集、并集、差集、分组、综合加工、转换类型、字符串处理、算数运算、日期处理、自定义SQL等。

04 产品价值

数据智能平台包括如下产品价值:

  • 多源异构数据集成

    支持以全可视化方式接入多源异构数据,包括结构化、半结构化和非结构化d等数据类型,包括MYsql、Oracle、DB2、MogoDB、Hive等20+种数据源,同时支持ETL、API、CDC、OLAP实时等数据接入方式。

  • 全链条数据治理服务

    提供数据标准管理、元数据管理、主数据管理、数据质量管理,打造一体化数据治理体系,从多个层面定义数据质量规则,全面监控数据全生命周期各环节,实现全面稽核和预警,通过严谨的数据质量评分机制,让数据治理有理有据。

  • 强大的数据挖掘分析能力

    面向不同的数据处理场景,针对不同的数据处理人群,提供可视化数据分析计算工具,通过可视化拖拽的方式,即可完成业务模型设计和数据分析工作,实现离线数据、实时数据快速融合处理,降低了技术门槛,大幅提高数据开发效率和降低开发成本。

  • 高效、低门槛数据开发工具

    全流程可视化,拖拉拽设计方式,简单、高效、使用门槛低,预置丰富的大屏模版和行业模版,支持设计组件自定义,灵活打造个性化大屏样式。

  • 灵活适配、轻松部署

    全面适配各种底层存储计算平台,包括HDP、CDH、华为FI以及MPP数据库Mysql、Oracle、DB2等,根据项目规模灵活选择项目方案,单机版或集群版;支持容器化部署,零基础半小时轻松完成全套产品部署。

图片

05 小结&预告

数据采集和存储数据治理数据价值开发既是用户数据资源积累的基础能力,又是对数据进行分析、挖掘,形成数据产品,产生数据价值的核心能力,为后续的数据应用和数据资产变现打下良好的基础。

小兵会在系列文章的下篇继续围绕数据的应用和数据资产变现阶段,介绍我们数据智能平台的另外三大核心能力:数据应用开发、数资登记运营、数资价值评估。敬请期待!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2103448.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LabVIEW程序员错误排查思路

当LabVIEW程序员在开发过程中遇到难以解决的错误且网上搜不到答案时,需要采取系统性的方法进行排查和解决。这包括回顾代码逻辑、深入理解LabVIEW的底层机制、参考专业文献和求助社区等方式。下面将从多角度详细解读专业程序员在面对这种困境时的应对策略&#xff0…

【系统分析师】-面向对象方法

目录 1、基本概念 2、UML 2.1、基本结构 2.1.1.构造块 2.1.1.1、事物 2.1.1.2、关系 2.1.1.3、图形 2.1.2.规则 2.1.3.公共机制 2.2、41视图 3、面向对象分析OOA 3.1、用例模型 3.2、分析模型 4、面向对象设计OOD 4.1、细分 4.2、设计原则 5、面向对象的程序设…

一字线模组厂家的选择与使用技巧

在当今自动化与智能制造的浪潮中,一字线模组作为精密定位与传输的核心部件,其性能与质量直接关系到整个生产线的效率与稳定性。因此,选择合适的一字线模组厂家并掌握其使用技巧,对于提升企业竞争力至关重要。接下来我们跟着鑫优威…

四、配置三层交换实验组网

一、实验拓扑 二、实验目的 通过配置交换机&#xff0c;令不同vlan间的主机能够互相通信 三、实验步骤 SW12 <Huawei>undo terminal monitor Info: Current terminal monitor is off. <Huawei>system-view Enter system view, return user view with CtrlZ. [H…

Spring 学习笔记

概述 Spring 是一个企业级 J2EE 应用开发一站式解决方案&#xff0c;其提供的功能贯穿了项目开发的表现层、业务层和持久化层&#xff0c;同时&#xff0c;Spring 可以和其他应用框架无缝整合 Spring 的特性包括以下几个方面&#xff1a; 轻量&#xff1a;Spring 是一个轻量…

CISAW软件安全开发模型的核心思想

在软件安全开发的领域中&#xff0c;采用的模型与信息安全保障体系紧密相连&#xff0c;它们共同构成了一个坚实的防御机制。 这种模型不仅注重程序、数据和文档三个实体对象的全生命周期管理&#xff0c;还强调实现这些对象的可用性、完整性、真实性、机密性和不可否认性等关…

Cesium 展示——绘制等值线图

文章目录 需求分析资料需求 分析 首先需要开启地形数据 开启方式见:地形开启否则会遇到以下问题直接上实例代码export function getPoints

mysql 8.0 的 建表 和八种 建表引擎实例

文章目录 MySQL 8.0 中&#xff0c;主要有以下八种常见的建表引擎一、InnoDB 引擎建表注意点建表知识点 二、MyISAM 引擎建表使用场景 三、Memory 引擎使用场景 四、Archive 引擎五、BLACKHOLE 引擎一、特点二、适用场景三、注意事项 六、MRG_MyISAM 引擎MRG_MyISAM 和 MyISAM …

Echarts可视化

echarts是一个基于javascripts的开源可视化图表库 画图步骤&#xff1a; 1.引入echarts.js文件 <script src" https://cdn.jsdelivr.net/npm/echarts5.5.1/dist/echarts.min.js"></script> 也可将文件下载到本地通过src引入。 2. 准备一个呈现图表的…

spring boot3框架@Validated失效

项目中使用的springboot3.2.1,在使用Validated校验controller里参数时始终不生效&#xff1b;在网上查了相关资料&#xff0c;添加了spring-boot-starter-validation依赖但还是不行 经过层层调试&#xff0c;终于发现问题&#xff1b; springboot3添加Validated后校验的是 ja…

唯众2024年高职云计算实训室方案解读

一、引言 1.1 云计算技术的发展背景 云计算技术自本世纪初开始迅速发展&#xff0c;已经成为信息技术产业的重要组成部分。随着数据量的爆炸性增长和互联网技术的不断进步&#xff0c;云计算提供了灵活、可扩展的计算资源&#xff0c;为企业和个人用户提供了按需使用计算资源…

设计模式 -- 观察者模式(Observer Pattern)

1 问题引出 1.1 天气预报项目需求 气象站可以将每天测量到的温度&#xff0c;湿度&#xff0c;气压等等以公告的形式发布出去(比如发布到自己的网站或第三方)。 需要设计开放型 API&#xff0c;便于其他第三方也能接入气象站获取数据。 提供温度、气压和湿度的接口 测量数据…

C语言指针进阶二:(函数指针数组,转移表)

函数指针数组 函数指针数组就是存放函数指针的一个数组&#xff0c;数组里都是函数指针&#xff0c;那么该怎么定义: int (*parr[10])(); 因为 [] 的优先级高于 * &#xff0c;所以parr先与 [] 结合说明是一个数组&#xff0c;元素类型是 int(*)() 的函数指针。 函数指针…

Tool-SQL:基于Agent智能体的Text2SQL解决方案,显著提升Text2SQL效果

Tool-SQL&#xff1a;基于Agent智能体的Text2SQL解决方案&#xff0c;显著提升Text2SQL效果 近期&#xff0c;Text-to-SQL 技术通过整合数据库系统的反馈&#xff0c;有效利用了大型语言模型&#xff08;LLMs&#xff09;。尽管这些技术能有效纠正 SQL 查询的执行错误&#xff…

计算机工具软件安装攻略:Visual Studio Code下载

Visual Studio Code下载、安装和使用 1 Visual Studio Code简介 Visual Studio Code通常简称为VS Code&#xff0c;是一款由微软开发的免费、开源的轻量级代码编辑器。它在开发者社区中非常受欢迎&#xff0c;具有强大的功能和扩展性&#xff0c;适用于多种编程语言和开发场景…

文章解读与仿真程序复现思路——中国电机工程学报EI\CSCD\北大核心《考虑极端事件的电力系统惯量与一次调频备用联合规划配置方法》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

统计学习与方法实战——统计学习方法概论

统计学习方法概论题 统计学习方法概论实现统计学习方法的步骤统计学习方法三要素模型策略损失函数与风险函数定义 常用损失函数经验风险最小化(ERM)与结构风险最小化(SRM) 模型评估与模型选择过拟合与模型选择 正则化与交叉验证泛化能力生成模型与判别模型生成方法判别方法 最小…

制定精益生产现场管理和改善计划时,企业需要考虑哪些因素

在制定精益生产现场管理与改善计划时&#xff0c;企业需综合考虑多个维度&#xff0c;以确保计划既能高效实施&#xff0c;又能持续推动生产流程的优化与效率提升。以下是深圳天行健企业管理咨询公司对这一过程中需重点考虑因素的详细阐述&#xff1a; 一、企业现状 1. 生产流…

Datawhale X李宏毅苹果书进阶 AI夏今营 task03学习笔记

batch normalization(批次标准化&#xff09; batch normalization--Tarining 直接改error surface的landscape&#xff0c;把山“铲平”有时候尽管error surface是个“碗”&#xff0c;都不见得好train。如下图所示&#xff1a; w1,w2对loss的斜率差别很大&#xff0c;w1方…

解锁SQL无限可能 | 利用SQL实现13位条码检测算法

目录 0 需求分析 1 数据准备 2 问题分析 3 小结 数字化建设通关指南专栏原价99&#xff0c;现在活动价39.9&#xff0c;按照阶梯式增长&#xff0c;直到恢复原价 0 需求分析 算法&#xff1a;给定一个n位的数字字符串&#xff0c;取出这个条码字符串的前n-1位数字&…