OB SQL引擎和存储引擎

news2025/1/10 3:28:26

文章目录

  • 一 SQL引擎
    • 1.1 双模共存
    • 1.2 基本操作
    • 1.3 查看SQL的执行计划
  • 二 存储引擎
    • 2.1 传统数据库存在的问题
    • 2.2 LSM-Tree存储
    • 2.3 OceanBase转储和合并
    • 2.4 控制内存数据落盘
    • 2.5 LSMTree存储压缩
  • 三 备份恢复
    • 3.1 物理备份系统架构
    • 3.2 物理恢复系统架构

一 SQL引擎

1.1 双模共存

SQL引擎支持MySQL和Oracle兼容模式
在这里插入图片描述

  • 同一个集群,同时支持mysql和oracle
  • 租户创建时需要配置为MySQL兼容模式或Oracle兼容模式
  • DBA由原来维护“多个数据库产品”变为维护一个“统一的数据库产品”,DBA可以结合应用需求,创建不同兼容模式的租户

MySQL兼容模式

  • MySQL 5.6语法全兼容
  • 兼容MySQL通信协议,MySQL应用可直接迁移至OceanBase

Oracle兼容模式

  • 兼容Oracle 11g语法
  • 支持90%的Oracle数据类型和内置函数;还在持续完善中
  • 支持分布式执行的存储过程(PL/SQL)

1.2 基本操作

  • 有关增删改查的基本操作,与sql语法内容一致,可以直接使用Mysql、Oracle的基本操作,这里不再赘述
  • OceanBase官网包含MySQL模式和Oracle模式的开发者文档和SQL参考文档

1.3 查看SQL的执行计划

  • 查看SQL的执行计划-EXPLAIN命令
explain [extended] <sql statement> \G
  • 使用非常方便,无需创建单独系统表,可直接获取语句的执行计划
  • extended选项会产生更多详细内容,排查执行计划问题时建议指定
  • 命令的输出格式和Oracle数据库的EXPLAIN工具比较接近,可读性好
  • 只获取执行计划,并不真正执行

二 存储引擎

2.1 传统数据库存在的问题

传统数据库有随机写、写放大等问题

  • 大量随机写:buffer pool和表空间页面“一一对应”,数据更新时会在磁盘上产生频繁的随机写(check point)
  • 写放大:随机写导致SSD的写放大问题,影响性能及磁盘寿命
    在这里插入图片描述
    读数据
  • 如果buffer Pool中有,则直接从内存读,如果没有,则从硬盘中提取到buffer pool中
  • 可以提升热数据的读取速度,减少时延
    写数据
  • 修改数据时,先将数据写到buffer pool,再刷新到磁盘
  • 通过check point将脏数据刷新到硬盘中,造成随机写和写放大:数据页离散分布,造成大量随机写,延迟大,影响性能;SSD上的随机写会导致严重的写放大,不仅影响写操作性能,而且显著降低SSD的寿命;一般使用高端读写型的SSD

2.2 LSM-Tree存储

  • 准“内存数据库”+ LSM-Tree存储,避免随机写
    在这里插入图片描述
  • 增量数据直接写入内存,并将Redo-Log落盘及同步给从副本后,即可通知业务成功
  • 内存占用率达到阈值后冻结MemTable,并执行转储/合并等操作以释放内存空间
  • 内存增量数据批量合并到磁盘,以顺序写代替随机写
  • 读数据时,需要从热点缓存、MemTable以及转储SSTable中读取数据,保证数据一致性
    技术优势
  • 读写分离:读内存和写内存分开
  • 提升写速度:准内存处理,数据修改主要是内存操作,无频繁 check point操作,提高写性能
  • 避免随机写:内存的脏数据批量合并之后,顺序写入SSD硬盘,避免随机写,提高写性能并延长SSD寿命
  • 数据持久性:为避免内存中数据丢失,redolog以WAL机制实时落盘,保证数据持久
  • 降低成本:磁盘数据按主键有序排列,磁盘碎片少,并提供快速检索能力。使用普通读密集型SSD硬盘
  • 底层存储会划分微块(micro block)和宏块(macro block),由数据库内部管理

2.3 OceanBase转储和合并

在这里插入图片描述
转储操作(minor freeze)

  • 是不断的把内存的 MemTable 写入磁盘以释放内存空间
  • 转储过程首先会冻结 MemTable(阻止当前的 MemTable 再有新的写入),并生成新的活跃 MemTable
  • Partition 副本可以独立决定冻结当前 MemTable,并转储到磁盘上
  • 转储出的数据只与相同大版本的增量数据做数据归并,不与全局静态数据合并

合并操作

  • 将动静态数据做归并,会比较费时。当转储产生的增量数据积累到一定程度时,通过Major freeze实现大版本的合并

磁盘数据按主键有序排列,提供快速检索能力。内存增量数据(MemTable)分多级做批量归并(Minor-Major),最终整合到磁盘
(SSTable),对整体性能影响较小


  • 转储和合并的最大区别:合并是集群上所有的Partition在一个统一的快照点和全局静态数据进行合并的行为,是一个全局的操作,最终形成一个全局快照
转储(Minor freeze)合并(Major freeze)
Partition 级别,只是 MemTable 的物化全局级别,产生一个全局快照
每个 Partition 独立决定自己 MemTable 的冻结操作,主备 Partition 无需保持一致全局 Partition 一起做 MemTable 的冻结操作,要求主备 Partition 保持一致
转储只与相同大版本的 Minor SSTable 合并,产生新的 Minor SSTable,所以只包含增量数据,最终被删除的行需要特殊标记合并会把当前大版本的 SSTable 和 MemTable与前一个大版本的全量静态数据进行合并,产生新的全量数据

2.4 控制内存数据落盘

触发memstore内存dump操作的阈值

  • freeze_trigger_percentage参数;默认值是70,即memstore的内存写满70%时,自动触发转储或者合并,具体行为取决于参数设置

转储(minor freeze)的时机

  • 内存达到阈值后自动触发
  • 手工触发:以root@sys用户执行alter system minor freeze;命令

合并(major freeze)的时机

  • 定时合并:由major_freeze_duty_time参数控制,默认值是"02:00"
  • 手工触发:以root@sys用户执行alter system major freeze;命令
  • 转储次数已满:当转储次数已经达到major_compact_trigger参数指定的次数时,自动触发合并;值为0时则关闭转储,直接触发合并

支持轮转合并,多个Zone按次序合并


关闭合并

  • enable_major_freeze = False; 建议保持默认值True
  • enable_manual_merge = True; 开启手工合并,需要手工触发所有的合并操作。极少数特殊运维场景会用到,不建议使用
    合并的并发线程数
  • merge_thread_count参数控制并发度,并发的粒度为分区
  • 默认值是0(系统自动判定并发度),值过大可能会影响在线业务性能
  • 数快速写内存场景(如批处理)中,可以适当调大并发度,加快内存dump的速度

2.5 LSMTree存储压缩

  • LSMTree存储高数据压缩率,降低存储需求
    在这里插入图片描述

三 备份恢复

3.1 物理备份系统架构

在这里插入图片描述

  • 支持 OSS、NFS 和 COS 三种备份介质,提供了备份、恢复、管理三大功能。支持手动删除指定的备份和自动过期备份的功能
  • 物理备份由数据备份和日志归档两个功能。数据备份指备份基线数据,包括全量备份和增量备份;日志归档指日志数据的自动归档功能

3.2 物理恢复系统架构

在这里插入图片描述

  • 支持租户级别的恢复,恢复是基于已有备份数据重建新租户的过程。用户只需要一个alter system restore tenant命令,就可以完成整个恢复过程
  • 恢复过程包括租户系统表和用户表的Restore和Recover 过程。Restore是将恢复需要的基线数据恢复到目标租户的OBServer,Recover是将基线对应的日志恢复到对应OBServer

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1393756.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网安-入门永恒之蓝/黑

永恒之蓝 实验环境&#xff1a;win7&#xff0c;kali 实验目的&#xff1a;拿到win7管理员权限 扫描该网段 nmap -sP 192.168.164.0/24&#xff0c;查看win7ip&#xff0c;也可在win7上查询 扫描端口&#xff0c;445&#xff0c;永恒之蓝是通过445端口进行攻击的 masscan -…

个人网站制作 Part 8 添加电子邮件通知与社交媒体集成 | Web开发项目

文章目录 &#x1f469;‍&#x1f4bb; 基础Web开发练手项目系列&#xff1a;个人网站制作&#x1f680; 添加电子邮件通知&#x1f528;使用Nodemailer&#x1f527;步骤 1: 安装Nodemailer &#x1f680; 社交媒体集成&#x1f528;使用社交媒体API&#x1f527;步骤 2: 集成…

多输入多输出 | Matlab实现基于LightGBM多输入多输出预测

多输入多输出 | Matlab实现基于LightGBM多输入多输出预测 目录 多输入多输出 | Matlab实现基于LightGBM多输入多输出预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 Matlab实现基于LightGBM多输入多输出预测&#xff08;完整源码和数据&#xff09; 1.data为数据集&a…

使用企业订货软件的担忧与考虑|网上APP订货系统

使用企业订货软件的担忧与考虑|网上APP订货系统 网上订货系统担心出现的问题 1&#xff0c;如果在订货系统中定错(多)货物了该怎么办 其实这也是很多人在网购或者是现实中经常会犯的一个错误&#xff0c;但是网上订货平台为大家提供了很多的解决方案&#xff0c;其中对于订单的…

腾讯云 腾讯云服务器 - 腾讯云 产业智变·云启未来

腾讯云服务器CVM提供安全可靠的弹性计算服务&#xff0c;腾讯云明星级云服务器&#xff0c;弹性计算实时扩展或缩减计算资源&#xff0c;支持包年包月、按量计费和竞价实例计费模式&#xff0c;CVM提供多种CPU、内存、硬盘和带宽可以灵活调整的实例规格&#xff0c;提供9个9的数…

jmeter-线程数设置为1,循环10次没问题,循环100次出现异常

一、多次尝试&#xff0c;发现出现异常的接口大致相同。 解决办法&#xff1a;在第一个出现异常的接口下添加超时时间&#xff0c;固定定时器&#xff1a;2000ms&#xff0c;再次运行就没问题了。 二、压力机自身存在的问题 1&#xff09;在网络编程中&#xff0c;特别是在短…

IOS-数据持久化UserDefaults简单使用-Swift

UserDefaults通过key-value的一种持久化方案&#xff0c;以键值对的形式存储基本类型数据&#xff0c;类似与安卓的SharePreferences。 使用方式&#xff0c;首先就是要获取standerd let userDefaultUserDefaults.standard存取字符串 //存取字符串 var greeting "Hello…

一款 StarRocks 客户端工具,支持可视化建表、数据编辑

什么是 StarRocks&#xff1f; StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理&#xff0c;就可以用 StarRocks 来支持多种数据分析场景的极速分析。 为了…

循环异步调取接口使用数组promiseList保存,Promise.all(promiseList)获取不到数组内容,then()返回空数组

在使用 vue vant2.13.2 技术栈的项目中&#xff0c;因为上传文件的接口是单文件上传&#xff0c;当使用批量上传时&#xff0c;只能循环调取接口&#xff1b;然后有校验内容&#xff1a;需要所有文件上传成功后才能保存&#xff0c;在文件上传不成功时点击保存按钮&#xff0c…

django电影推荐系统

电影推荐 启动 ./bin/pycharm.shdjango-admin startproject movie_recommendation_projectcd movie_recommendation_project/python manage.py movie_recommendation_apppython manage.py startapp movle_recommendation_applspython manage.py runserver Using the URLconf d…

CSS||引入方式

目录 CSS引入方式 行内样式表&#xff08;行内式&#xff09; 内部样式表&#xff08;嵌入式&#xff09; 外部样式表&#xff08;链接式&#xff09; 引入外部样式表 CSS引入方式 CSS&#xff08;层叠样式表&#xff09;是一种用来描述文档样式的样式表语言&#xff0c;它…

【备战蓝桥杯】探索Python内置标准库collections的使用

&#x1f308;个人主页: Aileen_0v0 &#x1f525;热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ​&#x1f4ab;个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-q0zvWxZtAIdSGZ8R {font-family:"trebuchet ms",verdana,arial,sans-serif;font-siz…

高密数据中心卓越运维,更灵活助力企业 AI 就绪

AIGC的高速发展将企业对基础架构的需求推上了新的层次&#xff0c;根据中国通服数字基建产业研究院发布的《中国数据中心产业发展白皮书&#xff08;2023&#xff09;》报告&#xff0c;互联网行业客户对单机柜功率密度的要求较高&#xff0c;一般在6-8kW&#xff0c;金融行业处…

centos7 arm服务器编译安装gcc 8.2

前言 当前电脑的gcc版本为4.8.5&#xff0c;但是在编译其他依赖包的时候&#xff0c;出现各种奇怪的问题&#xff0c;会莫名其妙的中断编译。本地文章讲解如何自编译安装gcc&#xff0c;替换系统自带的gcc。 环境准备 gcc 需要 8.2&#xff1a;下载地址 开始编译 1、解压gcc…

Azure Machine Learning - 聊天机器人构建

目录 聊天机器人架构概述消耗成本环境准备打开开发环境部署和运行将聊天应用部署到 Azure使用聊天应用从 PDF 文件获取答案使用聊天应用设置更改答复行为 本文介绍如何部署和运行适用于 Python 的企业聊天应用示例。 此示例使用 Python、Azure OpenAI 服务和 Azure AI 搜索中的…

【记录】解决 git 仓库突然出现连接失败

问题描述 今天在 push 代码代码的时候突然发现无法 push(但是我可以正常打开 Gihub)&#xff0c;这可不行&#xff0c;我可是 git 的重度使用者&#x1f60d;&#xff0c;我所有的代码都托管在了 Github 上&#xff0c;没有它我的日子怎么活啊&#xff01;&#xff01;&#x…

通讯录(C语言版)(静态通讯录)

✨欢迎来到脑子不好的小菜鸟的文章✨ &#x1f388;创作不易&#xff0c;麻烦点点赞哦&#x1f388; 所属专栏&#xff1a;项目 我的主页&#xff1a;脑子不好的小菜鸟 文章特点&#xff1a;关键点和步骤讲解放在 代码相应位置 引言&#xff1a; 1.菜单 通讯录也如同游戏&…

【史上最全】前端页面深入浅出浏览器渲染原理

前言 浏览器的核心组件&#xff0c;即通常所说的浏览器内核&#xff0c;是支撑整个浏览器运行的关键性底层软件架构&#xff0c;它由两个关键组成部分构成&#xff1a;一个是负责网页内容解析和渲染的渲染引擎&#xff0c;另一个则是用于执行JavaScript代码的JS引擎。各浏览器厂…

汽车芯片「新变量」

编者按&#xff1a;汽车行业的格局重构和技术革新&#xff0c;也在推动芯片赛道进入变革周期。不同商业模式的博弈&#xff0c;持续升温。 对于智能汽车来说&#xff0c;过去几年经历了多轮硬件和软件的性能迭代&#xff0c;甚至是革新&#xff0c;如今&#xff0c;市场正在进…