数据孤岛的突破口在哪里?

news2024/9/20 11:01:43

国务院于2021年12月发布的《“十四五”数字经济发展规划》中提到,我国数字经济发展中数字鸿沟问题未得到有效解决,各行业应充分发挥数据要素作用,加强数据治理和监管工作。“数据孤岛”问题虽早已被提出,但至今仍然存在,大量的“数据孤岛”对企业数字化转型产生不利影响,“数据孤岛”问题亟待解决。

如何解决“数据孤岛”问题,实现数据互联互通,从而更好地推进企业数字化转型?小亿想和大家共同探讨企业“数据孤岛”问题的形成原因及其弊端,为实现数据互联互通寻求解决路径。

一、什么是数据孤岛?

在日益庞大和复杂的社会中, 无论是个人的生产生活还是整个社会的协调运作, 所有的决策和判断都要依靠数据来进行, 数据成为个人、组织、社会乃至国家的战略资源。尤其在商业领域,数据逐渐成为企业的重要资产和竞争力来源, 因此数据垄断和数据割据也就成为数据市场的必然。

当前,业界和企业都意识到数据割据问题的存在, 并将其形象地命名为“数据孤岛”——数据被割据和垄断形成一个个彼此隔绝的孤零零的数据岛屿。数据孤岛在早期多被用来形容企业内部因技术壁垒或部门分隔而形成的信息孤立现象, 被称为“IT环境中最基本元素——数据的离散状态”。由此引发了关于数据集成的技术和理念之争。后来“数据孤岛”一词开始应用于不同的行业和领域中, 如图书馆信息系统和城市信息系统建设、政府治理和国家层面的信息化建设中。随着营销传播领域对于数据需求的逐渐强烈,数据获取过程中的种种困难使得数据孤岛概念开始在营销传播行业中盛行开来。

如赵伟在《封建的BAT》中将数据孤岛定义为“因为技术差距和遗留问题等形成的数据分散与无法集中共联的现象”,其主体就是垄断数据的数据方;而秒针系统首席营销官赵洁则从秒针的第三方媒体和用户数据检测角度, 将数据孤岛定义为同一用户的不同终端设备上的数据孤立状态。可见, 数据孤岛是营销传播行业中因利益割据而导致的涉及多方的数据离散状态。

二、数据孤岛是如何产生的?

一般来说,组织内存在数据孤岛的原因有以下几个:

1、部门化

当组织内的不同部门或团队拥有自己的数据库或系统来存储数据时,就会出现数据孤岛。如果每个部门负责管理自己的数据并且没有所有数据的中央存储库,就会发生这种情况。

2、技术壁垒

数据孤岛也可能是由技术壁垒造成的,例如软件或硬件平台的差异,这会导致难以跨部门或跨系统共享数据。

3、缺乏标准化

如果不同的部门或团队使用不同的标准或格式来存储和组织数据,就会出现数据孤岛,从而难以整合来自不同来源的数据。

4、组织文化

数据孤岛也可能是组织文化的结果,因为某些部门或团队可能会因为担心失去对数据的控制或看不到共享的价值而犹豫是否共享数据。

总体而言,数据孤岛可能是由技术、组织和文化因素共同造成的。为了解决数据孤岛并改善数据管理和集成,组织可能需要同时考虑技术和非技术方法,例如实施集中式数据存储库、实施数据治理和数据管理实践,以及培养数据共享和协作的文化。

三、数据孤岛有什么危害?

企业内不同部门数据的“各自为政”,大大制约着企业管理和业务的顺畅开展,具体来说,有以下这些危害。

1、数据重复

由于数据流通不畅,企业各部门在收集数据时会产生重复行为,造成了数据的重复、冗余、无效等情况,降低了数据的质量和准确度。

2、错误决策

数据的不准确、不及时,往往导致企业决策错误或决策迟缓,从而影响企业的口碑和在市场中的竞争地位。

3、协作不良

企业内部数据孤岛现象的显著,会在很大程度上使得企业各个部门、团队之间,因难以获取工作需要的数据,而关系紧张、协作不良。

4、效率低下

由于不同部门对数据的理解和定义不同,企业内部的沟通成本上升。同时,各部门对数据的重复管理,造成了时间和金钱的浪费、工作效率的低下。

5、客户体验差

企业内各部门拥有的数据不一,容易造成客户端到端的体验混杂,总体评价低。

四、如何解决数据孤岛?

对于企业来说,解决数据孤岛问题是一个系统性的工程,因此可以使用多种策略来消除数据孤岛并促进数据的共享和使用。

1、实施集中式数据存储库

一种方法是创建一个单一的、全面的数据源,组织内的所有部门和团队都可以访问该数据源。这可以采用数据仓库或数据湖的形式,后者是结构化和非结构化数据的大型集中式存储库。

正如亿信华辰提出的的仓湖一体大数据中心建设方案涵盖了数据存储、数据集成、数据交换、数据共享等方面,综合数据湖、数据仓库两种技术演进方向,为企业用户提供云原生仓湖一体解决方案。

仓湖一体大数据中心平台是基于大数据技术的全新数据应用平台,它提供云原生特性、支持存算分离架构、继承RDBMS数据库功能和ACID特性、支持工业级SQL标准、混合MPP+DAG计算引擎等一系列关键技术。帮助企业有效应对大规模、多样化、高时效、智能化的数据应用需求,为企业从BI到AI提供全新的数据基础架构。

2、使用数据集成和数据管理实践

实施数据治理和数据管理策略有助于确保以一致和受控的方式正确管理和使用数据。数据治理涉及建立一套用于在组织内管理和使用数据的规则和程序,而数据管理策略概述了存储、组织和使用数据的标准和最佳实践。

通过系统集成的方式将“数据孤岛”连接起来是解决“数据孤岛”问题最直接的方法。最流行的数据集成方式是提取、转换和加载(Extract-Transform-Load,ETL),从源系统中提取数据、整合数据并将其加载到目标系统或 应用程序中,将异构数据转换成同类数据进行使用。采用多源数据融合的方法,实现多源信息的交叉印证,数据信息相互补偿。在整合数据的过程中,将原有的数据信息从传统架构向云端进行数字化转型,并建立多元数据融合终端。这种云架构的数据转型可以缓解专有平台带来的“数据孤岛”问题,多元数据融合亦可实现数据共享互通,从一定程度上消减了数据安全和隐私的风险。

亿信华辰帮助赣州银行城商行建设的数据管理平台就完成包含元数据管理、数据标准管理、数据质量管控三大主体模块的数据管理平台建设,总计梳理8个主题、1244条标准,通过数据标准工具对7000多个关键字段进行落地评估,实现新信贷、新总账、新理财、核算等系统的注释填充率到达100%,基于EAST4.0,梳理了300余条规则,实现监管报送指标自动化,通过数据管理避免了“数据孤岛”的问题。

3、培养数据共享和协作的文化

鼓励数据共享和协作的文化可以帮助克服共享数据的阻力,并可以促进跨部门和团队共享见解和想法。“数据孤岛”最初的成因就是不同部门间存在数据不共通的情况,因此加强培养数据共享和协作的文化是十分有必要的。

4、加强利用数据集成和管理工具

有许多工具和技术可以帮助促进数据集成和管理,例如数据集成平台、数据管理平台和数据治理软件。这些工具可以帮助实现数据集成和管理流程的自动化,从而更轻松地在整个组织内共享和使用数据。

EsDataFactory即亿信数据工厂是一款面向数仓实施的自主研发的软件工具,集数据建模与ETL设计于一体,内置新型的混合计算引擎,支持广泛的数据源,可为政府或企业提供更快捷、更高效、更安全的数据集成解决方案。

亿信数据工厂产品架构

亿信华辰帮助湖南卫健委建设的省卫生计生统计决策分析系统就是一个例子。该系统建立了数据质量控制机制,通过对卫生统计数据的质量控制,提高直报系统数据质量;升级数据交换功能,将全员人口信息、公共卫生服务相关统计分析数据传输到本系统内;升级数据分析应用功能,整合新、旧数据模块,全面升级数据模型;建立移动终端应用。

利用数据工厂工具重新规划并整合卫生资源、医疗服务、医改监测、计生人口、分科及中医特色等主要业务数据,为各级卫生机构提供准确、便捷的信息访问服务,为深化医改与应急救治提供信息支撑,为制定卫生计生政策规划与宏观管理提供科学依据,是数据管理的有效工具。

5、提供培训和资源

提供培训和资源以帮助团队了解共享数据的好处以及如何有效地共享数据,这也是打破数据孤岛和改进数据管理和集成的重要一步。

因此,摆脱数据孤岛需要结合技术和非技术方法,多管齐下,并行解决问题。

四、小结

随着信息社会的来临, 价值日益彰显的数据日渐成为企业核心资产和竞争力的来源。同时,企业内部由于数字化建设尚未完善等问题,导致形成数据孤岛的现象愈加明显,这也成为制约行业发展的瓶颈。因此,如何破解这种数据孤岛困境成为企业当前面临的一大挑战。

企业内部的数据孤岛成因复杂,往往和信息技术、企业 管理、业务特点,以及政府的大数据发展协调机制、信息保护和开发的制度性文件、大数据标准化顶层设计等外部和内 部多方面因素相关联,而解决数据孤岛问题时也需要综合考虑以上各方面的因素,探索适合企业自身的方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/988664.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Git】Git 基础

Git 基础 参考 Git 中文文档 — https://git-scm.com/book/zh/v2 1.介绍 Git 是目前世界上最先进的分布式版本控制系统,有这么几个特点: 分布式:是用来保存工程源代码历史状态的命令行工具保存点:保存点可以追溯源码中的文件…

【docker快速部署微服务若依管理系统(RuoYi-Cloud)】

工作原因,需要一个比较完整的开源项目测试本公司产品。偶然发现RuoYi-Cloud非常适合,它有足够多的中间件,而且官方提供docker安装,但我本人在安装过程中遇到了很多坑,在这里记录一下防止下次会再次遇到。 项目地址 ht…

OpenCV 01(图像加载与显示)

一、机器视觉 现在说的机器视觉(Machine Vision)一般指计算机视觉(Computer Vision), 简单来说就是研究如何使机器看懂东西。就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传…

关于elementui表单验证数字的问题

千里之行始于足下 熟能生巧,不熟怎么生巧 最近编写项目时候遇到一个这样的问题,elementui 表单验证价格是否为数字, 正常来说只需要将规则写为如下 { required: true, type: number, message: "请填写正确的数字", trigger: "…

引爆用户参与:消息重弹,让您的推送不再被忽略

在当前各大APP拉新促活成本居高不下的大背景下,如何稳定存量用户、提升用户粘性就显得尤为关键。从促销活动到个性化推荐,从互动通知到功能提醒,消息推送已成为各大APP连接存量用户和目标市场之间的桥梁,通过点击推送,…

ADS1219芯片解读

使用10-kΩ热敏电阻的温度测量是使用比率测量实现的实现最佳精度的方法。模拟电源电压AVDD用作电阻器分压器配置中的热敏电阻,以及ADS1219的外部参考电压V REF。 ADS1219的输出代码和热敏电阻R热敏电阻之间的关系是通过以下方程式。公式 10将输入AIN0处的输入电压表…

全网超50万粉丝的Linux大咖良许,出书了!

全网超50万粉丝的Linux大咖良许 出书了! 今天我们要说的就是这本由Linux领域头部号主,良许老师编写的这本《速学Linux:系统应用从入门到精通》 如果你是刚开始学习Linux的小白同学,相信你已经体会到与学习一门编程语言相比&…

【源码解读】VUE2.0和VUE3.0响应式区别?

数据劫持的目的 VUE2.0和VUE3.0实现响应式的底层逻辑,是对数据做劫持,为什么要劫持数据呢?是因为,劫持数据后才可以,在更改数据同时对页面进行重新渲染,从而达到响应式。 VUE3.0响应原理 VUE3.0使用了ES…

适配器模式:如何让不兼容的接口变得兼容

在软件开发中,我们经常会遇到这样的情况:我们需要使用一个现有的类或者接口,但它与我们系统的目标接口不兼容,而我们又不能修改它。这时候,我们该怎么办呢?大多数情况下我们都可以使用适配器模式来解决这个…

hutool的HttpRequest.post的使用-包括上传文档等多个传参【总结版本】

首先hutool已经为我们封装好了远程调用的接口,我们只要将对应的传参和方式对应填写即可 hutool官方文档 1实际应用 post 常见的使用json传参,contend type为application/json RequestMapping("login") ResponseBody public static String s…

中国人大与加拿大女王大学中外合作办学金融硕士——学习是你世界的圆吗

有人说,可以把每个人的世界比作一个圆,学习是半径,半径越大,拥有的世界就越广阔。你认同这种观点吗,金融领域的你有想过拓宽知识的边界吗?来人大女王中外合作办学金融硕士项目在职读研,超越自我…

【多线程】线程 与 进程

线程 与 进程 一. 进程1. 操作系统2. 什么是进程/任务(Process/Task)3. 为什么要有进程3. 操作系统怎样管理进程4. 进程控制块抽象(PCB Process Control Block)5. 进程调度6. 内存分配 —— 内存管理(Memory Manage)7. 进程间通信…

【C++】匿名对象 | explicit | static静态成员 | 友元

匿名对象 有些情况下,我们创建变量只是临时用一用,以后不会再用到了。这时,如果创建变量还要起名字,是不是很多余? 对此,C引入了 匿名对象 供临时使用。 例如:如果我们创建对象slt&#xff0c…

什么是主动元数据管理?有何优势?

元数据是描述数据的数据,它提供数据的来源、含义、位置、所有权和创建等信息,主要用于跟踪、分类和分析。 元数据管理则是对元数据的创建、存储、整合、控制的一整套流程,是数据治理过程的一部分,能够支持基于元数据的相关需求和…

NFT Insider#106:The Sandbox 与 Light Matrix 以及鲁比尼拳击场达成战略合作

引言:NFT Insider由NFT收藏组织WHALE Members、BeepCrypto联合出品,浓缩每周NFT新闻,为大家带来关于NFT最全面、最新鲜、最有价值的讯息。每期周报将从NFT市场数据,艺术新闻类,游戏新闻类,虚拟世界类&#…

Android12之解析/proc/pid进程参数(一百六十四)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生…

python通过tkinter制作词云图工具

一、基本功能 1.采取上传文本文档(仅支持.txt格式)的方式统计词频 2.背景图形样式可选择已经设定好的,也可选择本地上传的(支持.png .jpg .jpeg格式) 3.本地上传的图片需要进行抠图处理,并将抠图结果保存…

大乘数法 -Java

题目链接:https://www.nowcoder.com/practice/c4c488d4d40d4c4e9824c3650f7d5571?tpId196&tqId37177&rp1&ru/exam/company&qru/exam/company&sourceUrl%2Fexam%2Fcompany&difficultyundefined&judgeStatusundefined&tags&titl…

SAP 批量删除变式

使用事务码se38进入变式,通过搜索帮助选中一个变式,点击显示。 点击目录,会显示所有的变式名称。 会显示当前程序的所有变式,然后点击删除按钮,选择需要删除的变式。

CVPR2023 RIFormer, 无需TokenMixer也能达成SOTA性能的极简ViT架构

编辑 | Happy 首发 | AIWalker 链接 | https://mp.weixin.qq.com/s/l3US8Dsd0yNC19o7B1ZBgw project, paper, code Token Mixer是ViT骨干非常重要的组成成分,它用于对不同空域位置信息进行自适应聚合,但常规的自注意力往往存在高计算复杂度与高延迟问题。…