本原数据:回归数据库技术本原,做难而正确的事

news2024/11/25 9:28:15

数据库技术是信息科技领域的最为重要的技术之一。随着科技的不断进步,数据库技术得到了迅速的发展,应用范围也越来越广泛。

与此同时在数据量持续高速增长的情况下,企业对据库也提出了更高的要求,例如数据存储越来越多,对数据库的性能要求越来越高;企业在数据迁移过程中,对据库的兼容性、安全合规性提出了新要求;应用场景多样化也需要数据库有更强的适应能力等。而目前大火的分布式数据库虽说可以实现对单个系统的总容量提升,但不能解决投入成本与业务容量收益的比例,即单位事务给客户带来的利润(事务利润)。

如何继续提升数据库的性能

回归数据库的技术本原,数据库的单机性能重回聚光灯下如本原数据技术合伙人张程伟所说:“就像高速路一样,可以不停地车道,但如果能把单通道的车速翻倍,那其实是更难却更有效的方向” 。本原数据的初心正是如此,也就是回归数据库技术的最本质的东西。

本原数据技术合伙人张程伟

提升单机性能,难而有道

“无论数据库跑在哪里,不管是线下还是云上,不管是私有云还是公有云,不管是分布式还是集中式,终归都需要一个内核在一台机器上跑起来。所以说,一个强大的单机内核是技术创新的重点,是数据库技术的本原。”本原数据技术合伙人金毅在2023数据技术嘉年华上这样感慨道

本原数据技术合伙人金毅

经历了数十年的发展,数据库技术解决的问题覆盖方方面面,积淀形成了相对成熟完整的体系结构。除了提供数据存储的功能外,数据库系统还需要满足丰富的数据管理的需求,所以数据库的性能,不能止步于此,还应该继续提升单机性能,只有单机性能上去了,分布式或者其他数据库技术,也才能再上一个台阶。

衡量一个技术在数据库内核当中是否是成功的运用,有一个非常简单的标准——在固定的数据计算负载前提下,能够为客户提供最低成本的方案,就是最好的技术。把成本投入和给客户提供的事务所带来的收益利润进行整合,本原数据就引入了事务利润”的概念越低成本投入获得越高事务处理能力,为客户带来更高业务容量就会带来更高的事务利润。只有事务利润空间有了,作为数据库和数据服务提供方与用户之间才更容易找到共赢。因此,从全生命周期角度度量方案的事务利润可以更有效度量数据库技术给用户带来的价值。

相对于集中式方案,分布式方案从理论上来讲会产生额外的网络通信成本,造成代码路径的延长和稳定性风险问题并不能提升客户的事务利润。因此,重新审视单机的性能发挥成为考虑的关键解决之道。如果单机性能能够得到数量级突破,在固定业务容量的前提下,小规模分布式方案可考虑简化成单机方案,大规模分布式方案可极大缩减系统实施规模;既简化硬件成本降低能耗碳排放,又提高系统稳定度减少系统维护成本,达到全生命周期的降本增效。

探究本原,金毅认为现代成本友好的主流硬件的性能无法被传统数据库内核充分发挥,总结当前硬件性能特征包括:众核CPU大容量内存SSD高速磁盘使用新内核实现思路和新算法是可以充分发挥现代硬件性能,结合在关键路径消除竞争热点和压榨无效计算达到数量级提升(下一代)数据库单机性能的目标。

  • 单机单核计算能力有限单机众核可以形成数量优势带来的大规模并行计算能力
  • 大内存可以将一个交易系统中频繁使用的热数据几乎完全驻留在内存里,这便意味着数据库内核设计和实现思想可以发生一个转变可以把主存中的业务数据作为数据计算和优化核心,去思考如何有效的使用它,而不是放在磁盘中的数据。因此以优化频繁发生的慢速I/O为主要目的的传统数据库内核实现思想,可以转变为以优化CPU和DRAM主存间性能瓶颈的新数据库内核实现思想。
  • SSD高速磁盘当前通过PCle到SSD,单盘就能够提供GB级每秒的I/O带宽,通过快速I/O能力,可以高效率移出冷数据或将冷数据交换回DRAM主存成为热数据支撑了上述以内存中热数据为中心的设计实现。
  • 在大比重围绕DRAM主存的数据计算中,其关键路径中无效的93%的指令可以通过采用新的数据结构和算法的实现尽量压缩和消除掉这为单机性能达到10倍提升提供了基础。
  • 当数据库计算更多围绕主存发生的时候,解决CPU与主存性能瓶颈,提高CPU计算实际效率成为重点。该关注点也曾因传统设计思路被忽略。CPU Cache效率成为解决该瓶颈的关键,技术优化方面包括提高CPU Cache命中率减少CPU Cache一致性同步和亲和性不足造成的CPU卡顿等待问题。
  • 传统数据库各主要模块的内部实现中大量存在集中式访问对象,在众核大规模并发场景下,产生拥塞热点严重影响众核计算性能发挥,需要新的技术实现尽可能分拆并行访问间冲突,解放并行效率。

本原数据在行动

本原数据合伙人张程伟表示,他们对技术的追求可以称得上“执着”,始终认为做技术不是一件花哨的事情,以产品为导向,会坚持打磨产品、创新产品。

目前,本原数据主要研发MogDB、Uqbar两款产品。

MogDB基于openGauss开源数据库的内核进行研发推出的一款企业级关系型数据库,核心适用于交易型场景。

Uqbar是在openGauss内核基础上的超融合时序数据库,可以用于管理海量时序数据,也可以用于OLTP场景管理关系数据,还支持跨时序数据和关系数据的复杂关联查询,为物联网场景提供一站式数据解决方案。

国产数据库,任重而道远

国产数据库蓬勃发展的同时也面临几个突出的问题

  • 可靠性和稳定性有待加强,数据库是整个应用系统的核心,一旦瘫痪意味着承载应用和业务中断;
  • 运维人员担迁移到国产分布式数据库后,运维技能和方式与原来相比有过大差异,无法对数据库进行有效运维;
  • 对原有应用系统升级的改造成本较高,担心架构和应用的兼容性出现问题
  • 不少国产数据库是对国外开源数据库的包装或者少量修改,难以称为真正的国产数据库。

当然现在国产数据库软件面对的系统环境与前些年相比已经有了很大的变化,国产数据库发展壮大,任重而道远,继续坚持做难而正确的事情是对其发展最大的助力

数据应用的变化倒逼数据库具备更大数据存储容量、更多数据计算模型、更快数据业务响应能力,整体技术发展进入后关系型阶段。行业应该在追求架构设计分布式化、模型构建场景化的同时,关注数据库技术内核,坚持打造产品的客户成功本质,坚持实事求是的技术创新选择从单机内核为起点的演进与革新路线分布式和上云更高效更有效

“明者见于无形,智者虑于未萌。”希望有更多的像本原数据这样的企业回归技术本原做难而正确的事

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/460072.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

海尔智家:智慧场景掌握「主动」权,用户体验才有话语权

2023年1月,《福布斯》AI专栏作家Rob Toews发布了年度AI发展预测,指出人工智能的发展将带来涉及各行业、跨学科领域的深远影响。变革将至,全球已掀起生成式AI热,以自然语言处理为代表的人工智能技术在快速进化,积极拥抱…

在maven工程下使用springmvc框架启动tomcat时报404 以及常见的错误和解决方式

以下的问题是我花了三天的时间解决的bug,网上找的各种资源都是一个样子,不能解决我的问题,非常的蛋疼。最后在咸鱼花了我15元找了个大神帮我调试的。 1.问题一 idea中通过maven已经导入了包,idea中也能定位到包的位置,本地maven仓…

用Python分析周杰伦歌曲并进行数据可视化

大家好,今天我们用python分析下周杰伦歌曲。为了尽量完整地呈现从原始数据到可视化的过程,接下来我们会先简单讲解数据的预处理过程,即如何将 JSON 数据转化为Excel 格式,以及如何对周杰伦的歌曲进行分词。 本案例中的歌词数据来…

RedHat Linux系统故障修复—— grub引导、MBR损坏修复过程

一、故障问题 MBR损坏是一种非常常见的错误,两种情况:1.MBR文件损坏 2.grub目录被误删除 1.首先,MBR是安装在硬盘的第一个扇区上占用了512个字节,其中前446字节是bootloader用于引导操作系统(中间的64个自己用来指定…

KDJB-802C继电器成组保护校验仪

一、功能与用途 可对各种继电器(如电流、电压、反时限、功率方向、阻抗、差动、低周、同期、频率、直流、中间、时间等)及微机保护进行检定,并可模拟各种复杂的瞬时性、转换性故障进行整组试验。 二、主要技术参数 交流电流输出:…

多项目并行,如何用飞项快速获取关键信息与进展?

在企业中,多项目并行是常态。 项目经理身兼数职,既要掌握多个项目的关键信息,也要关注卡点与延期风险,跟踪关键任务进度。但常常存在与多个项目负责人对接信息延迟、环节卡点不清晰、文件繁多凌乱导致效率底下的问题。 今天就来…

这可能是你看过最详细的Java集合篇【一】—— ArrayList

文章目录 List集合的特点List集合常见实现类继承关系ArrayList继承关系数据结构和相关变量构造方法添加元素相关方法动态扩容机制 查找元素相关方法删除元素相关方法清空方法遍历方法其它方法常见面试题 List集合的特点 List集合的特点:存储元素有序、可重复、有索…

Shiro 实战教程(全)

目录 1.权限的管理 1.1 什么是权限管理 1.2 什么是身份认证 1.3 什么是授权 2.什么是shiro 3.shiro的核心架构 3.1 Subject 3.2 SecurityManager 3.3 Authenticator 3.4 Authorizer 3.5 Realm 3.6 SessionManager 3.7 SessionDAO 3.8 CacheManager 3.9 Cryptogr…

他们是怎么使用上gpt-4的-gpt-4在哪用

为什么有人在使用GPT4 openAI尚未正式发布GPT-4模型,也没有公布任何与GPT-4相关的信息。因此,没有人可以在使用GPT-4模型。 值得注意的是,虽然OpenAI尚未正式发布GPT-4,但由于其之前发布的GPT-3具有出色的性能和功能&#xff0c…

JVM 垃圾回收算法

之前说堆内存中有垃圾回收,比如Young区的Minor GC,Old区的Major GC,Young区和Old区 的Full GC。 但是对于一个对象而言,怎么确定它是垃圾?是否需要被回收?怎样对它进行回收?等等这些问题我们还需…

【3. 初学ROS,年轻人的第一个Node节点】

【3. 初学ROS,年轻人的第一个Node节点】 1. 工作空间设置2. 创建Package3. 回访依赖包4. 创建Node节点5. 源码编译6. 运行Node节点7. Node节点完善8. 总结 本教程是B站阿杰视频的笔记 视频地址:https://www.bilibili.com/video/BV1nG411V7HW 超声波传感器…

SqlServer2022安装与配置_并用Navicat连接SqlServer---sqlserver工作笔记0001

首先去下载 SQL Server 下载 | Microsoft https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 首先去下载安装包,这里我们下最新的 下载这个免费版的 可以看到下面有个全功能免费版本下载他 然后点击安装 下载以后安装 选择自定义 然后安装

策略模式——时势造影响

● 策略模式介绍 在软件开发中常常遇到这样的情况:实现某一个功能可以有多种算法或者策略,我们根据实际情况选择不同的算法或者策略来完成该功能。例如,排序算法,可以使用插入排序、归并排序、冒泡排序。 针对这种情况&#xff0c…

机器学习 day09(如何设置学习率α,特征工程,多项式回归)

常见的错误的学习曲线图(上方两个) 当关于迭代次数的学习曲线图,出现波浪型或向上递增型,表示梯度下降算法出错该情况可由,学习率α过大,或代码有bug导致 常用的调试方法: 选择一个非常非常…

【学习笔记】unity脚本学习(六)【GUI发展历程、IMGUI控件、Layout自动布局】

目录 unity 界面发展IMGUINGUI其他GUI插件uGUIUI 工具包比较 GUI基础GUI静态变量Unity扩展编辑器屏幕空间的总尺寸Screen.width 和 Screen.height GUI静态函数(GUI控件)Label图片 Box控件Button与RepeatButtonTextFieldTextAreaPasswordField其他控件 GU…

MySql主从复制原理及部署

MySql主从复制 原理: 1、Master节点开启binlog,并将变动记录到binlog中; 2、Slave节点定期探测Master节点的binlog,如有变动,开启I/O线程向Master节点请求二进制事件; 3、Master节点为每一个I/O线程启动…

win10卸载MySQL8.0

停止MySQL服务 shiftctrlesc打开任务管理器 将MySQL服务停止,这里我只有一个MySQL服务,如有多个MySQL服务,也要全部停止掉。 卸载mysql server等设备 控制面板 -》程序 -》 程序和功能,将mysql server等设备卸载掉,好…

SpringCloudAlibaba服务熔断、限流——Sentinel

Sentinel 本专栏学习内容来自尚硅谷周阳老师的视频 有兴趣的小伙伴可以点击视频地址观看 简介 Sentinel是Alibaba公司推出的一个熔断与限流工具,相当于我们之前学习的Hystrix,可以解决服务使用中的各种问题,例如:服务雪崩、服务降…

minigpt4搭建过程记录,简单体验图文识别乐趣

引言 从3月开始,aigc进入了疯狂的开端,正如4月12日无界 AI直播 在《探索 AIGC 与人类合作的无限可能》中关于梳理的时间线一样,aigc的各种产品如雨后春笋般进入了不可逆的态势,里面有句话很形象,人间一日,…

信息收集(四)服务器信息收集

信息收集(一)域名信息收集 信息收集(二)IP信息收集 信息收集(三)端口和目录信息收集 WAF指纹识别 什么是WAF WAF的全称是(Web Application Firewall )Web 应用防火墙用来过滤HTTP…