大道至简:数据库的终极未来

news2024/10/6 1:44:17

墨天轮2022年12月份的报告已经出炉,这一期的主题是:大道至简,自治为王

在公众号回复:下载  可以获得各期报告下载链接。

dc871bc38bec7c8ce1c57fac66a76864.png

数据库的终极未来是什么?这是行业里一直在探讨的命题,复杂但是也简单。

大道至简

564a709040e60e8731b26cd1919166df.png

01

Oracle 23c 提出的理念是 App Simple,亚马逊在 re:invent 2022 大会提出的一个理念是 ZERO ETL,其实都是在简化

只不过,有些简化是螺旋式上升,在走一条循环往复的进化之路。

在 Oracle 的世界里,应用简化的内涵是,通过多模数据库,不断融合各种数据类型、开发方法,使得万千应用熔于一炉。

b44a89d62e9eac0e01a47763e2b5e5f2.png

在 AWS 的世界里,则是将原有的Oracle数据库,替代为各种云上的RDS数据库,然后需要通过简化ETL,去加速数据复制和流通。

下图是2019年,亚马逊最终将 7500 个 Oracle 数据库中的 75 PB 内部数据迁移到多个 AWS 数据库服务,彻底去掉了Oracle。这一步是打破壁垒,数据库的品类和数目都会大大增加,但是云简化了管理,使得这一切可以达成。

b68b8a940f86436b4708b6e2b0a1012e.jpeg

在新的架构上,数据集成变得复杂,2022年AWS提出的 zero-ETL 就是来简化这一复杂性。首先解决的是自己的 OLTP 和 OLAP 之间的整合问题,Aurora 到Redshift 的数据同步问题。

8858a61aa629f2bd330e239079cb5489.png

这是解构再建构的过程。Oracle 使用一个数据库去解决 OLTP 和 OLAP 的双重需求,行列混存使得鱼和熊掌可以兼得。AWS 看似在进化的路上循环往复,但是本质上,云在底层使得这一切的变化更有意义。

 云的演进

043420c556029674f5a85a4df1461b2f.png

02

云数据库的演进,从自建数据库,到 PaaS 服务、云原生,再到Serverless,技术的进步是通过不断简化用户的管理和应用,从而让数据库的使用更简单,现在 Serverless 则是更进一步,能够以更精细化的弹性和计费,让经济性回归。

a971fb01ed16ce35af0863f27fbe9f06.png

这本质上,一直是一种商业模式的进化。

在Gartner 2022的魔力象限报告中,针对Oracle的陈述始终是云上的束缚和传统的成本印象,传统商业模式,始终是Oracle转型的巨大障碍

  • 对多种云的支持有限。甲骨文采取了自己的方式在多个云上使用。从历史上看,它没有在其他云上提供主要产品,尽管它一直试图设计实施架构,以消除跨云访问数据的任何不良影响,如延时。这种方法已经在Azure上得到了实施,并且正在发展用于AWS和Google的解决方案,但是对于寻求多云访问的买家来说,专有性的印象损害了Oracle。

  • 对成本的看法。甲骨文在许可条款和谈判技巧方面有很强的名声,多年来它已经失去了一些客户。这些做法所造成的印象挥之不去,导致人们认为甲骨文的云产品将比其他公司更昂贵。

  • 增长的挑战。尽管甲骨文公司在云计算方面进展缓慢,但它现在已经全力投入到云计算中。但它在云计算世界中缺乏客户意识,而在云计算世界中,大量的新系统正在实施,这对它造成了伤害。虽然甲骨文公司的产品和愿景都接近顶尖水平,但其产品被评估的频率远远低于全云供应商和云服务提供商的产品。

在国内厂商中,阿里云 PolarDB 的 Serverless 化演进一直走在前列,并且通过了信通院Serverless的认证评测,TiDB 在海外也推出了云上 Serverless 版本。

 数据库无感化

1d84e372a3ce7d10429f58c33b487f30.png

03

Serverless 技术,本质上又是一种简化,简化了环境管理和应用开发。在这一造词序列上,还有 Diskless,自然也有 Databaseless,数据库的无感化将是数据库发展的终极未来

82ce05bbd39d2627dc6bb2b3fea09abd.png

所有的 less 思想,都可以用第一性原理重新注解。随着时间的流逝和技术的创新,任何现有的流程和认知,都可以重新被审视,追本溯源重新发现问题,以寻求更佳的解决方案。Serverless 和 Databaseless 都是重新来审视架构的复杂性,用进步的技术替代原有架构中的落后环节,从而让用户实现更佳的技术无感知,让开发者更加聚焦业务。

Serverless 在数据库上的关键技术包括,资源池化与弹性扩展、高可用、高性能、低成本。低成本虽然看似技术无关,但是其本质上要依赖技术上的极致弹性和动态伸缩。而高可用和高性能是数据库的持续追求。只不过今天这些技术,基于云有了新的征途。

4b2dc193742b9c5fca78784e9848eb95.png

 智能加持

8945e278c9eb17225829918069a7cb06.png

04

数据库无感知的进一步进化基础当然是AI,AI4DB & DB4AI,数据库和智能技术不断融合促进,实现数据库的自治智能。

所以在11月的主题报告中,我们选择的课题就是智能:极智穷思,数往知来。

cdb16683f1fc08edcdd2ff7443ddfd40.png

近年来,随着大数据、机器学习算法、新型硬件技术的发展,几乎所有行业对 AI 的需求都在快速增长。DB与AI相结合成为当前热门的研究主题之一。

DB 和 AI 的功能界限变得模糊,用户需要兼具 DB 和 AI 的混合分析功能,AI 原生数据库将是解决这个需求的关键技术;AI 原生数据库一方面扩展 SQL 的算子来支持 AI 算子,实现库内的训练和推理,一方面通过数据库内置 AI 算法来提升数据库的智能优化、智能运维;AI原生数据库在数据模型、数据操作和系统部署层面都带来新的挑战。

52f3ebae8edc4a63197ceb7b7f2779ff.png

湖仓一体

42360338eb22420c644f0e53b80496da.png

05

然而知易行难,每一步的技术进步都需要大量的积累和探索。中科软左总在2022年度的“中国软件技术大会“分享了湖仓一体化技术发展趋势的主题。

湖仓一体的本质,仍然是简化。通过一体化,试图将业务上前后系统、主文辅文、结构化半结构化等数据,“实时”结合起来进行运算,从而支持决策

然而湖仓一体化涉及到大量的开源工具集,需要大量工程实践验证,还远谈不上成熟。

11e536585c16cd551a4d5d97b55729cb.jpeg

在解决湖仓一体,或者说,交易和分析业务场景时,HTAP 成为一个重要选项,其实从Oracle的 In-Memory 组件,到 Google 的 AlloyDB,都是通过行列混存,试图将事务和分析融于一体

在这个趋势上,云原生数据库、HTAP混合数据库、数据仓库,在加速走向融合。这事实上扩大了云数据库的边界,云更进一步的吞噬传统数据库的市场。Snowflake 的成功是率先作出的表率,在那之后 MySQL HeatWave、Google AlloyDB 都在这一方向上加速进化。

Gartner 2022年度魔力象限对 Snowflake的评价就是如此:Snowflake Data Cloud解决了分析、数据仓库和数据湖的需求。Snowflake正在投资其Snowpark功能,以提供AI/ML支持,最近增加了Python支持,最近宣布打算也提供事务能力。今年早些时候,Snowflake收购了Streamlit,一个低代码的应用程序开发框架,以及Applica,以扩展对非结构化数据的分析。

3027a4c2fa2d0d6a175acf369f81ca2f.png

 新DBA时代

94bf37d12b85f8d381149565ccfdc95e.png

06

由于各种开源技术的引入,数据的快速爆炸式增长,在新的系统建设中,传统DBA的作用变得更加重要,这个变化是从管理(Administrator)到架构(Architecture)的变化。

只有做好前期的数据架构的选型、规划、建设,才能够实现可持续的企业数据环境。才能够在快速变化的数据库技术中,减少投资浪费,持续高效的支撑业务发展。

这意味着,DBA的工作重心要从传统战术性工作(这些工作基本上可以被自动和智能化应用,自动完成)转变到战略性工作上来

战术性工作并非不重要,只是靠人的知识长期积累才能掌握的运维和优化能力,需要循环往复不断的培养人才能实现,无法满足快速变化的业务和技术需求,所以别无他法,要么是数据库软件自身通过简化和智能实现,要么是外在的平台工具自动和智能的实现。

在数据库层面,在核酸检测年代暴露出来的并发障碍,其实和20年前我们遇到的数据库问题别无二致,优化手段也毫无差别,然而靠人力去优化解决总是后发。我们最终认识到,要看软件自身,消除人工的介入。在 MogDB 数据库上,通过自治事务提交解决日志写的瓶颈,通过自治的分区特性解决热点表的高竞争问题...从而去降低人工优化的介入和技能要求。

在平台工具层面,传统的 DBA 工作也正在加速被平台和产品所替代,云和恩墨的 zCloud 产品就是在这一方向上构建的私有云 dbPaaS 平台,而公有云上自然有云厂商的管理平台。从云上到云下,从传统DBA到CloudDBA,传统的工作自动化,新的工作全局化

433abe49e23cb6a52ae2e4cebb3f8482.png

DBA的工作,必须更向前、更向全局发挥作用。这些全局化的战略性工作就包括:

  • 架构、规划、数据模型 - 越是向前迈进呈现的数据价值影响将会越明显;

  • 数据安全和数据生命周期管理 - 数据安全随着数字经济发展越加重要;

  • 应用相关的调优和优化 - 优化尤其是前置优化,其价值越来越被重视;

  • 端到端的服务级别管理 - 数据架构融入全局,端到端的可视化和诊断;

3801118f9825be9255d4746f12592ddf.png

(参考我在2019年的演讲,阅读原文可以获取)

从数据库、数据仓库到数据湖,再到湖仓一体(Lakehouse),大道至简,而抵达之途曲折艰辛!

信息技术的迷人之处正在于,我们永远在路上!


云和恩墨大讲堂 | 一个分享交流的地方

长按,识别二维码,加入万人交流社群

请备注:云和恩墨大讲堂

  点个“在看” 

你的喜欢会被看到❤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/125811.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

硬盘无法格式化怎么解决?数据丢失怎么恢复?

有时遇到一些特殊情况,需要我们对电脑磁盘进行格式化。但是硬盘无法格式化,这时我们应该怎么进行操作?你可以根据下面的操作,通过磁盘的创建权限,或者通过磁盘管理来进行格式化,一起来看看下面的简单操作&a…

威固的MOM,你的WOW 「 WOW 手武之道」威固巅峰技术交流赛圆满收官

近日,由全球特种材料公司伊士曼旗下汽车膜品牌威固(V-KOOL)举办的2022威固WOW手武之道技术交流会&PK赛,顺利收官。来自各地服务商的多位技师光芒尽显,展示贴装艺术,分别赢得广州站、南京站、郑州站及成…

WEB应用安全测试丨Acunetix功能简介

快速查找并修复使您的Web应用程序面临攻击风险的漏洞。享受更多的安心——无需花费更多有限的时间。 产品功能 发现与爬行 01、发现所有需要扫描的东西 Acunetix会自动创建所有网站、应用程序和API的列表,并使其保持新状态。 这意味着您不会留下未扫描且容易受到…

00后少年的心力之作(已开源) | heartt(心力算法)

心力之作: 综合性极强的文本摘要算法: heartt(心力算法) 大家好,我是 heartt 算法的作者。我今年 13 岁,是一名热爱编程的学习者。 今天,我要向大家介绍我的新算法:heartt。 00后少年的心力之作(已开源) | …

xxx 拘留室项目

1.项目介绍 本项目用于当地拘留室,定位:监控、值班系统,项目时间:十二月。 系统涉及人员:值班人员、拘留人员 设备:摄像头(海康)、门禁(中控安防)、声光报警…

特色功能(锐捷云桌面篇)

大家好,我是小杜。转眼居家办公已经一周多了,有没有小伙伴和小杜一样,感觉还是在公司上班好,进入状态快呢。现在的主要精力是业务上,处理完对应业务后,就开始了“快乐”的学习了。还是相信之前纯粹的学习时…

常见的5种数据分析方法有哪些?

看大家介绍了那么那么多的数据分析方法,但不同的数据分析方法使用场景不同,A常用的B不一定常用。 所以这篇只介绍5种基于逻辑层面的,几乎人人都会用的数据分析方法。 先来分享一下数据分析6大步骤: 按照这6个步骤,结合…

uni-app的条件编译

条件编译了解 前言: 由于本次业务有 PC 端H5 页面,还有 手机端的H5页面,不同的端,模块展示可能不同,但是大部分功能又是相同的。 如果通过简单的 if…else… 判断不同端,调用相应的 API 或 展示相应的模块…

设计模式——设计思想

设计模式——设计思想一、面向对象的四大特性:1、封装2、抽象3、继承4、多态二、抽象类和接口类1、抽象类和接口的语法特性2、抽象类和接口存在的意义3、抽象类和接口的应用场景4、抽象类和接口的区别三、面向对象编程与面向过程编程1、面向对象编程和面向对象编程语…

mac中nvm管理node

目录检查电脑上是否存在node卸载node安装nvm报错查看本机的ip地址修改host文件重新安装nvm - 报错重新安装nvm - 报错安装完成兼容性运行之前的项目 -> 报错运行之前的项目 -> 报错常用命令nvm安装之前若是电脑上存在node,要先将node卸载掉检查电脑上是否存在…

catia建模圆柱直齿轮和斜齿

1 圆弧近似方案 参考 7.1 直齿轮(简单)1_哔哩哔哩_bilibili 2 渐开线生成点--》生成样条曲线方案 参考 7.2渐开线齿廓直齿圆柱齿轮(1)_哔哩哔哩_bilibili xd基圆半径rb *sin(t*PI*1rad)-基圆半径rb *t*PI*cos(t*PI*1rad) yd基…

如何做好性能压测(一):压测环境的设计和搭建

本文是阿里巴巴 PTS 团队《Performance Test Together》系列专题分享,霍格沃兹测试学院经特别授权转载,也会结合学员实际需求组织大咖公开课主题分享,文末有福利! 性能压测,是保障服务可用性和稳定性过程中&#xff0c…

MySQL校招集锦

数据库面试集锦 1.请说下你对MySQL架构的了解 先看一下MySQL的架构图 大体来说,MySQL 可以分为 Server 层和存储引擎两部分。 Server 层包括:连接器、查询缓存、分析器、优化器、执行器等,涵盖了 MySQL 的大多数核心服务功能,…

2.hadoop系列之组成简介

本文我们了解hadoop3的组成部分,如下图所示,包括HDFS数据存储、Yarn资源调度、MapReduce计算 1. HDFS概述 HDFS: Hadoop Distributed File System,是一个分布式文件系统 HDFS由NameNode、DataNode、Secondary NameNode组成 NameNode:存储文…

Zabbix监控docker容器状态信息详解

前言 本篇文章针对zabbix server已部署完成的情况。docker 容器是一个开源的应用容器引擎,让开发者可以以统一的方式打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何安装了docker引擎的服务器上(包括流行的Linux机器、windows机…

UGUI-ContentSizeFitter之最简单实现maxSize限制

步骤 方法思路如下: 复制ContentSizeFitter源码出来,改名为ContentSizeFitterEx (AddComponentMenu里面的名字也需要改。)FitMode增加枚举MaxSize增加序列化属性m_MaxHorizontal和m_MaxVertical修改HandleSelfFittingAlongAxis增…

智能商业化模式:信息流广告的动态展现策略

丨目录: 摘要 引言 问题建模 实验 总结与展望 关于我们 参考文献▐ 摘要大多数的信息流场景会向用户展现自然内容和商业化内容(广告)的混合结果。一种比较常见的做法是,将广告限定在固定位置进行展现,但由于这种静态广…

7 常用类实例

常用类 1 object类 类的声明:public class object 类所属的包:java.lang object是所有类的根类Java中的所有类,如果没有特殊说明,则默认继承object object的派生类对象都可以调用这些方法,派生类一般会对根据需要重…

2022最新CKA认证指南看这里

目录 🧡CKA简介 🧡CKA报名 🧡注意事项 🧡题目 💟这里是CS大白话专场,让枯燥的学习变得有趣! 💟没有对象不要怕,我们new一个出来,每天对ta说不尽情话&…

代码随想录——二叉树

二叉树遍历 基本介绍: 二叉树主要有两种遍历方式: 深度优先遍历:先往深走,遇到叶子节点再往回走。【前中后序遍历】广度优先遍历:一层一层的去遍历。【层序遍历】 这两种遍历是图论中最基本的两种遍历方式 深度优…