数据虚拟化:零数据搬运,实现全域数据的集成和自适应加速

news2024/7/6 18:09:34

数据虚拟化技术的兴起,与传统数据仓库体系的弊端日益显现有着密切关系。

过去,企业通常会构建数据仓库来存储与加工结构化数据。数据仓库虽然实现了数据的物理集中存储,但过于依赖大量的 ETL 工程师来支持数据的集成、准备、开发与管理。随着半结构、非结构化数据量的急剧膨胀,以及业务看数、用数需求的高频化,传统的数据仓库体系已逐渐无法有效应对这些新挑战。

一方面,对于 ETL 工程师而言,海量数据的处理和管理变得更加繁重,人工作业难以快速响应业务侧日益增长的需求。若选择扩大 ETL 团队规模,不仅会加重企业的人力成本负担,同时也可能因团队规模的扩大而引发管理和协调上的新问题。另一方面,随着业务复杂度的提升和各类新业务的涌现,业务人员对数据的依赖性和期望也在迅速增强,越来越希望以更高效、更便捷的方式获取到更全面、更准确的数据支持。

简言之,数据消费端即业务人员,期望通过自定义数据查询来高效实现跨源、跨环境数据的透明集成、自助准备及高性能服务供给,从而实现全链路的自助用数。传统 ETL 已难以应对,数据虚拟化技术应运而生。

数据虚拟化技术是 Data Fabric 架构理念的核心技术,使用户能够通过统一的接口,无需数据复制,即可直接访问和整合分散在众多数据源中的异构数据。

它通过逻辑整合不同数据源、位置及格式(涵盖数据库、文件系统、云存储等)的数据,隐藏了底层数据存储位置、技术接口、代码语言、使用平台等技术的复杂性和差异性,并通过逻辑视图提供统一的数据服务,让用户可以像访问单一数据源一样来查询、分析和操作数据。这不仅显著降低了传统 ETL 工程中数据复制、搬运、加工的高昂成本,还极大地提升了数据开发与变更的敏捷性和效率。

与传统的 ETL 工程相比,数据虚拟化技术具有以下三大优势:

  • 零复制:通过将各种不同的、分布式的数据源,无论是本地还是云端,进行统一映射,创建一个具有语义一致性的虚拟数据层、统一的数据定义语法、统一的数据模型定义,实现对企业全域数据的访问。
  • 逻辑化:隐藏了数据环境和 ETL 链路的复杂性,能够让数据开发工程师更专注于数据模型的设计,而不是陷于琐碎枯燥的物理数据管道的运行监控、变更响应、性能调优、链路变更等运维工作上,在降低成本的同时带来更高的扩展性,实现敏捷开发。
  • 实时性:数据虚拟化实时“连接”底层数据来源,可向下游各个应用程序提供最新数据。

作为国内 Data Fabric 理念的实践者和引领者,Aloudata 大应科技打造了国内首个 Data Fabric 逻辑数据平台—— Aloudata AIR,通过自研的数据虚拟化技术,可帮助企业轻松实现多源异构数据的集成整合和自适应加速。具体来看,Aloudata AIR 平台主要由数据连接层、数据虚拟化层、数据消费层构成:

  • 数据连接层:在这一层,用户可以轻松地将企业全域数据逻辑连接起来,无论物理位置和数据格式如何,均可快速访问,且无需复制数据,让数据随手可得。
  • 数据虚拟化层:完成数据连接之后,在这一层用户可以通过自动化的链路编排和 AI 增强的自适应查询加速保障功能,实现跨数据源的数据整合,对数据进行处理加工,满足业务分析需求。
  • 数据消费层:进入这一层,平台提供了如 JDBC 等各种标准化接口,对接下游指标平台、BI 工具及其他数据应用工具,用户可以在自己熟悉和喜欢的工具上进行数据分析和应用,实现数据普惠化。

此外,Aloudata AIR 平台还提供了统一数据资产目录,利用 AI、知识图谱等技术增强数据的语义,生成 360° 数据资产报告,帮助用户快速掌握数据资产全貌,并支持通过语义化搜索、类目/标签筛选等方式,快速且清晰地理解数据背后的业务含义。

在具体实践中,Aloudata AIR 也已经取得了显著成效,如某券商通过该平台连接了 100 多个数据库,虚拟映射了 2 万多张表,实现交付效率提升至少 10 倍,研发链路管理工作量减少 30%,数据存储和计算成本节约 50%。Aloudata AIR 在招商银行的敏捷数据准备与分析场景中的实践成果更是入选 2023 中国信通院大数据“星河”标杆案例。

如果您现在计划推进多源异构数据的统一整合或集成,或者考虑构建敏捷的数据服务层,提升业务用数的效率,那不妨先了解下 Aloudata AIR 逻辑数据平台,或许能为您带来新的思路。点击了解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1794698.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SEATA如何起步

https://seata.apache.org/zh-cn/https://seata.apache.org/zh-cn/ seata官网网址 Seata术语:(具体看官网) 具体SEATA有几种模式: TCC , AT(即自动模式): 因为 , 事务已经提交 , 肯定无法 回滚 , 所以TCC模式是需要自己自己写补偿代码, AT则是需要一份UNDO_LOG 表 来告诉AT模…

DxO ViewPoint v4.16 解锁版安装教程 (校正几何和透视的图像处理)

前言 DxO ViewPoint中文版是一款能够校正几何和透视的图像处理软件,摄影师通过ViewPoint破解版修复构图和光学缺陷并恢复拍摄对象平衡,重新调整如弯曲架构和扭曲图案等细节,让图像具备更强冲击力和更优平衡性。 一、下载地址 下载链接:http://dygod/source 点击搜…

智能交通SCI期刊,中科院2区,IF=7.9,国产期刊,影响力高,口碑佳

一、期刊名称 Digital Communications and Networks 二、期刊简介概况 期刊类型:SCI 学科领域:智能交通 影响因子:7.9 中科院分区:2区 三、期刊征稿范围 《数字通信与网络》与科爱出版社和重庆邮电大学合作出版季刊&#xf…

关于Stream.toList()方法使用小记

对照示例 public static void main(String[] args) {final List<String> list new ArrayList<>();list.add("aa");list.add("bb");list.add("cc");list.remove("cc");System.out.println(list);}结果&#xff1a; Stre…

SAS:import进来的excel数据集中的空格无法去除

目的&#xff1a;如果去除ECGTPT中的空格&#xff1f; 尝试&#xff1a;用compress函数或者strip无法去除正解&#xff1a;kcompress(ecgtpt,0d’x);释疑&#xff1a; 中间空的地方不是空格&#xff0c;是换行符。因数据集是UTF-8编码&#xff0c;还需要用kcompress替换compres…

详解 Flink 的运行架构

一、组件 1. JobManager 作业管理器是一个 Flink 集群中任务管理和调度的核心&#xff0c;是控制应用执行的主进程 1.1 JobMaster JobMaster 是 JobManager 中最核心的组件&#xff0c;负责处理单独的作业&#xff08;Job&#xff09;。JobMaster 和具体的 Job 是一一对应的&…

rpm安装

rpm安装 命令格式&#xff1a; rpm 【选项】 文件名 选项&#xff1a; -i&#xff1a;安装软件 -v:显示安装过程信息 -h:用#表示安装进度&#xff0c;一个#代表2% -ivh&#xff1a;安装软件&#xff0c;显示安装过程 -e:卸载软件 -q:查看软件是否安装 -ql&#xff1…

码农危是否到来? AI大模型时代到来程序员能做啥?

前言 “马斯克提到人工智能会让工作变得毫无意义&#xff0c;并建议人们可能需要去编写人工智能程序&#xff0c;以避免被AI剥夺就业”&#xff0c;AI大模型的爆发&#xff0c;各种自动化编码应用工具&#xff0c;AI机器人出现&#xff0c;“前有2023年2月份&#xff0c;ChatG…

「实战应用」如何用图表控件LightningChart JS创建SQL仪表板应用(一)

LightningChart JS是Web上性能特高的图表库&#xff0c;具有出色的执行性能 - 使用高数据速率同时监控数十个数据源。 GPU加速和WebGL渲染确保您的设备的图形处理器得到有效利用&#xff0c;从而实现高刷新率和流畅的动画&#xff0c;常用于贸易&#xff0c;工程&#xff0c;航…

Polar Web【简单】php very nice

Polar Web【简单】php very nice Contents Polar Web【简单】php very nice思路EXP运行&总结 思路 打开网页源代码&#xff0c;由下图的代码&#xff0c;可见本题涉及到反序列化以及变量覆盖。 因此考虑传递GET参数a来构造序列字符串。 由上图中的代码&#xff0c;在Exampl…

8.7k Star!Khoj:你的AI第二大脑、开源RAG Cop​​ilot、平替 MS Copilot与ChatGPT

原文链接&#xff1a;&#xff08;更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号&#xff01;&#xff09; 8.7k Star&#xff01;Khoj&#xff1a;你的AI第二大脑、开源RAG Cop​​ilot、平替 MS Copilot与ChatGPT &#x1f31f;你的AI第二大脑。…

Splatter Image: Ultra-Fast Single-View 3D Reconstruction

Splatter Image: Ultra-Fast Single-View 3D Reconstruction 飞溅图像&#xff1a;超快速单视图3D重建 Stanislaw Szymanowicz  Christian Rupprecht  Andrea Vedaldi 克里斯蒂安鲁普雷希特安德烈韦达尔迪 Visual Geometry Group — University of Oxford {stan,chrisr,vedal…

优卡集团冲刺港股上市:90后创始团队孵化,IPO前突击大额分红

现年26岁的鲁圳&#xff0c;正在带领其6年以来的创业成果冲击资本市场。 近日&#xff0c;金融居间机构服务商优卡集团&#xff08;Yoc Group&#xff09;向港交所递交上市申请&#xff0c;民银资本为其独家保荐人。透过招股书可知&#xff0c;优卡集团成立于2018年&#xff0…

自动化测试-Selenium(一),简介

自动化测试-Selenium 1. 什么是自动化测试 1.1 自动化测试介绍 自动化测试是一种通过自动化工具执行测试用例来验证软件功能和性能的过程。与手动测试不同&#xff0c;自动化测试使用脚本和软件来自动执行测试步骤&#xff0c;记录结果&#xff0c;并比较预期输出和实际输出…

Gitlab---添加描述模版

0 Preface/Foreword Gitlab是代码托管平台&#xff0c;DevOps。因其免费&#xff0c;被广泛使用。GitLab不但可以管理代码&#xff0c;也可以管理issue&#xff0c;创建milestone等等。针对issue管理&#xff0c;支持描述模版功能&#xff0c;即对于新建的issue&#xff0c;可…

山东大学软件学院项目实训-创新实训-基于大模型的旅游平台(二十八)- 微服务(8)

目录 11.4 SpringAMQP 11.4.2 Work Queue工作队列 11.4.3 发布订阅模型 11.4.4 FanoutExchange(广播交换机) 11.4.5 DirectExchange(路由模式交换机) 11.4.6 TopicExchange 11.5 消息转换器 11.4 SpringAMQP 父工程引入AMQP依赖 <!--AMQP依赖&#xff0c;包含RabbitMQ…

redis哨兵练习

1、6台服务器&#xff0c;3台作一个主从&#xff0c;3台作哨兵 服务器IP主redis192.168.99.133从redis1192.168.99.139从redis2192.168.99.141哨兵1192.168.99.144哨兵2192.168.99.156哨兵3192.168.99.160 6台服务器安装好redis&#xff0c;全部执行&#xff1a; #把redis的…

C语言杂谈:函数栈帧,函数调用时到底发生了什么

我们都知道在调用函数时&#xff0c;要为函数在栈上开辟空间&#xff0c;函数后续内容都会在栈帧空间中保存&#xff0c;如非静态局部变量&#xff0c;返回值等。这段空间就叫栈帧。 当函数调用&#xff0c;就会开辟栈帧空间&#xff0c;函数返回时&#xff0c;栈帧空间就会被释…

读《淘宝技术这10年》:从进化中感受技术的美与挑战

本文作者:小米,一个热爱技术分享的29岁程序员。如果你喜欢我的文章,欢迎关注我的微信公众号“软件求生”,获取更多技术干货! 大家好,我是小米,一个29岁的程序员,喜欢分享技术干货。今天,我想和大家聊一聊我最近读的一本书——《淘宝技术这10年》。这本书让我深刻领悟…

解决IDEA拉取或提交代码时SSL certificate problem: unable to get local issuer certificate问题

在使用IDEA拉取或提交GitHub上的代码时提示如下错误&#xff1a; 解决方法如下&#xff0c;依次执行命令&#xff1a; 在项目根目录下&#xff0c;打开Git Bash 1、echo | openssl s_client -servername github.com -connect github.com:443 | sed -ne /-BEGIN CERTIFICATE-/…