OracleDG原理

news2025/1/12 4:08:53

一、DataGuard架构介绍

1、基本介绍

在DG环境中,至少会有两个数据库,一个数据库处于Open状态,对外提供服务,这个数据库叫做primary Database。第二个数据库处于恢复状态,叫做Standby Database。

运行时Primay Database对外提供服务,用户在Primary Database上进行操作,操作被记录在日志文件中。这些日志通过网络传送到Standby Database。这些日志会在Standby Database上重演,从而实现了数据的同步。

Oracle 的DG对这个过程进一步的优化设计,使得日志的传送、恢复工作更加自动化、智能化。

如果是可预见因素需要关闭Primay Database,例如软硬件的升级,可以把Standby Database切换为Primary Database继续对外提供服务,并且数据不会丢失。
如果是因为异常原因导致Primary Database不可用,也可以把Standby Database强制切换为Primary Database继续对外提供服务,这时数据损失程度和配置的数据保护级别有关系。

上面一大段话可以总结为以下三点:
1:primary Database上产生日志
2:primary Database将日志传给Standby Database
3:Standby Database根据接受到的日志进行重演
下面附上一张DG架构图,咱们就能更清晰的了解内部机制。

在这里插入图片描述

图中的data guard其实分为两种结构:

  • 通过LGWR发送日志和通过ARCH发送日志。
    • 通过ARCH则不必要非常好的网络资源,但数据实时性也大打折扣。
  • 通过LGWR也就意味着具有更高的实时性,数据丢失率较低。但也非常依赖网络资源,同样也受数据保护模式的影响。

2、DG相关的后台进程

ARCH (archiver) :心跳检测,探测对方
LNS (log-write network-server) :log传送
RFS (remote file server) :远程接数据
FAL (Fetch Archive Log ) :解决Redo的间隔Gap
MRP (Managed Recovery Process) :日志被应用,恢复的过程
LSP (Logical Standby Process):逻辑数据库的后台进程,SQL转换

FAL介绍:

FAL(Fetch Archive Log)是 Oracle Data Guard 中的一个关键特性,它的作用是在备用数据库(Standby Database)上自动检测并解决归档日志的间隔(Gap)问题。这个过程确保了备用数据库能够持续与主数据库(Primary Database)保持同步,即使在归档日志传输过程中出现丢失或延迟的情况。

FAL 工作原理:

  1. 归档裂缝(Archive Gap):当主数据库上的事务日志(Redo Logs)由于某些原因未能及时传输到备用数据库时,就会在备用数据库上形成归档裂缝。这可能是由于网络问题、磁盘空间不足或其他原因导致的。
  2. 裂缝检测:备用数据库会定期检测归档日志的完整性,一旦发现裂缝,即日志序列中断,就会触发 FAL 进程。
  3. 日志请求:作为 FAL_CLIENT 的备用数据库会向配置为 FAL_SERVER 的主数据库或其他备用数据库发送请求,以获取缺失的归档日志。
  4. 日志传输:FAL_SERVER 接收到请求后,会从其归档日志存储中检索出缺失的日志,并通过网络发送给 FAL_CLIENT。
  5. 日志应用:备用数据库上的 FAL_CLIENT 接收到缺失的归档日志后,会将其传输给负责日志应用的进程(如 RFS - Redo File Services),这些进程将日志写入备用数据库的归档日志或在线重做日志中。
  6. 数据同步:随后,备用数据库上的 MRP(Managed Recovery Process)或 LSP(Log Writer Process)进程会应用这些日志,以确保备用数据库的数据与主数据库保持一致。

FAL 的重要性:

数据一致性:通过自动解决归档裂缝,FAL 确保了备用数据库的数据与主数据库保持同步,这对于数据保护和灾难恢复至关重要。
高可用性:FAL 减少了人为干预的需求,提高了系统的自动化程度,从而增强了整个系统的可用性。
减少停机时间:在主数据库发生故障时,由于备用数据库始终保持最新状态,可以快速切换到备用数据库,最小化业务中断时间。

3、功能划分

相关服务按功能区分:

  • 日志发送 (redo send):
    Primary Database 运行过程中,会源源不断地产生Redo 日志,这些日志需要发送到Standy Database。 这个发送动作可以由Primary Database 的LGWR 或者ARCH进程完成, 不同的归档目的地可以使用不同的方法,但是对于一个目的地,只能选用一种方法。 选择哪个进程对数据保护能力和系统可用性有很大区别。
  • 日志接收 (redo recieve):
    Standby Database 的RFS(Remote File Server)进程接收到日志后,就把日志写到Standby Redo Log或者Archived Log文件中,具体写入哪个文件,取决于Primary 的日志传送方式和Standby database的位置。如果写到Standby Redo Log文件中,则当Primary Database发生日志切换时,也会触发Standby Database上的Standby Redo Log 的日志切换,并把这个Standby Redo Log 归档。 如果是写到Archived Log,那么这个动作本身也可以看作是个归档操作。
  • 日志应用 (redo apply):
    日志应用服务,就是在Standby Database上重演Primary Database日志,从而实现两个数据库的数据同步。 根据Standby Database重演日志方式的不同,可分为物理Standby(Physical Standby) 和 逻辑Standby(Logical Standby)。

4、DATA GUARD的三种数据保护模式

所谓数据保护模式是指在Standby Database和Primary Database之间数据同步的程度。Data Guard允许定义三种数据保护模式,分别是最大保护(maxmium protection)、最大可用(maxmium availability)、最大性能(maxmium performance)。

最大保护模式(maxmium Production)
这个级别保证Standby Database和Primary Database的数据是完全同步的,即使Primary Database突然宕机,在Standby Database上不会有任何数据丢失。
这种模式下,Primary Database上的每个事务的Redo日志必须在本地和Standby Database上都写入日志文件后才能提交,如果不能写入到Standby Database,Primary Database就会自动关闭以防止数据丢失。
这种方式要求Standby Database必须配置Standby Redo log,而Primary Database必须使用LGWR、SYNC、AFFIRM方式归档到Standby Database。(AFFIRM,磁盘io控制,保证主备库日志同时写完)

最大性能(Maxmium Performance)
这个模式是缺省模式,他更加侧重对Primary Database的可用性不造成任何影响。
Primary Database上的事务的Redo日志只要写到本地日志文件就可以提交,不必等待到Standby Database的传递完成。
Primary Database的Redo流可以异步的发送到Standby Database。
这种模式通过LGWR ASYNC或者ARCH实现,Standby Database也不要求使用Standby Redo Log。

最大可用性(Maxmium Availability)
这种模式会尽量避免数据丢失,Primary Database每个事务的Redo日志要写到本地和Standby Database中才能提交。
这个和最大保护模式不同的是,如果写入到Standby Database失败,Primary Database不会自动关闭。这时Primary Database会自动转换为Maxmium Performance模式,等待问题解决并且Standby Database再次和Primary Database同步之后,Primary Database会自动的转换为Maxmium Availability。
这种模式会尽量的避免数据丢失,但不能绝对保证数据完全一致。
这种模式要求Standby Database必须配置Standby Redo log,而Primary Database必须配置为LGWR、SYNC、AFFIRM方式归档。

如果要修改数据保护模式,则可以按照以下操作进行。

shutdown immediate;
startup mount;
# 修改模式(这里以最大可用性为例)
alter database set standby database to maxmium availability;
# 打开数据库
alter database open;
# 确认模式已经修改
select protection_mode,protection_level from v$database;

二、DG原理

tip:ARCH的结构和LGWR的结构均为日志发送 (redo send)内容

1、ARCH的结构

在这里插入图片描述

1、Primary Database不断的产生Redo Log,这些日志被LGWR进程写到联机日志
2、联机日志写满以后,发生日志切换,触发ARC0完成本地归档
归档位置采用LOG_ARCHIVE_DEST_1=‘LOCATION=/path’
3、完成本地归档以后,联机日志可以被覆盖重用
4、ARCH1进程通过Net把归档日志发送给Standby Database的RFS进程
5、Standby Database端的RFS(Remote File Server)进程把接受到的日志写入到归档日志
6、Standby Database端的MRP(media recover process)进程(Redo Apply)或者LSP进程(SQL Apply)在Standby Database上应用这些日志,进而同步数据

这种方式最大的问题是:
Primary Database只有在发生归档时才会发送日志到Standby Database,如果Primary Database异常宕机,联机日志中的Redo内容会丢失,因此这种方式没法避免数据丢失的问题。
要想避免数据丢失,就必须使用LGWR,而使用LGWR又有SYNC和ASYNC两种方式。

2、LGWR的结构

在这里插入图片描述

LGWR又分为同步(SYNC)和异步(ASYNC)两种方式,下面分别介绍一下这两种方式

LGWR SYNC 同步方式

1、Primary Database产生的Redo日志要同时写到日志文件和网络。也就是说LGWR进程把日志写到本地日志文件的同时还要发给本地的LNSn进程(Network Server Process),再由LNSn进程把日志通过网络发送到远程目的地,每个远程目的地对应一个LNS进程,多个LNS进程能够并行工作。
2、LGWR必须等待写入本地日志文件的操作和通过LNSn进程的网络传送都成功,Primary Database上的事务才能够提交,这也是SYNC的含义所在。
3、Standby Database的RFS进程把接收到的日志写入到Standby Redo Log日志中
4、Primary Database的日志切换也会触发Standby Database上的日志切换,即Standby Database对Standby Redo Log的归档,然后触发Standby Database的MRP或者LSP进程恢复归档日志

因为Primary Database的Redo是实时传送的,于是Standby Database端可以使用两种恢复方式:
实时恢复(Real-Time Apply),只要RFS把日志写入Standby Redo Log就会立即进行恢复;
归档时恢复,在完成对Standby Redo Log归档才触发恢复。
Primary Database默认使用ARCHN进程,如果使用LGWR进程必须明确指定。使用LGWR SYNC方式时,可以同时使用NET_TIMEOUT参数,这个参数单位是秒,代表如果多长时间内网络发送没有响应,LGWR进程就会抛出错误。

LOG_ARCHIVE_DEST_2=‘SERVICE=ST LGWR SYNC NET_TIMEOUT=30’

使用LGWR SYNC方法的可能问题在于,如果日志发送给Standby Database过程失败,LGWR进程就会出错,也就是说Primary Database进程依赖于网络状况。一般也可以使用异步的LGWR模式,也就是LGWR ASYNC。

LGWR ASYNC 异步方式

1、Primary Database一端产生Redo日志后,LGWR把日志同时提交给日志文件和本地LNS进程,但是LGWR进程只需要成功写入日志文件即可,不必等待LNSn进程的网络传送成功。
2、LNSn进程异步地把日志内容发送到Standby Database,多个LNSn进程可以并发发送
3、Primary Database的Online Redo Log写满后发生Log Switch,触发归档操作,也触发Standby Database对Stand Redo Log的归档,然后触发MRP或LSP进程恢复归档日志

因为LGWR进程不会等待LNSn进程的响应结果,所以配置LGWR ASYNC方式时不需要NET_TIMEOUT参数

LOG_ARCHIVE_DEST_2=‘SERVICE=boston LGWR ASYNC’

3、日志接收(Redo Receive)

Standby Database的RFS进程接收到日志后,就把日志写到Standby Redo Log或者Archived Log文件中,具体写入哪种文件,取决于Primary的日志传送方式和Standby Database的配置。
如果是写到Standby Redo Log文件中,则当Primary Database发生日志切换时,也会触发Standby Database上的Standby Redo Log的日志切换,并把这个Standby Redo Log归档。
在日志接收中,需要注意的是归档日志被放在什么位置,Standby Database选择归档目录的算法如下。
在这里插入图片描述

1、如果配置了STANDBY_ARCHIVE_DEST参数,则使用这个参数指定的目录
2、如果某个LOG_ARCHIVE_DEST_n参数明确定义了VALID_FOR=(STANDBY_LOGFILE,*)选项,则使用这个参数指定的目录
3、如果数据库的COMPATIBLE参数大于等于10.0,则选取任意一个LOG_ARCHIVE_DEST_n的值
4、如果STANDBY_ARCHIVE_DEST_n和LOG_ARCHIVE_DEST_n参数都没有配置,使用缺省的STANDBY_ARCHIVE_DEST参数,这个缺省值是$ORACLE_HOME/dbs/arch

4、日志应用(redo apply)

日志应用服务,就是在Standby Database上重演Primary Database的日志,从而实现两个数据库的数据同步。

根据应用方式划分

根据Standby Database重演日志方式的不同,可分为物理Standby(Physical Standby)和逻辑Standby(Logical Standby)两种类型。
Physical Standby使用的是Media Recovery技术(MRP)),在数据块级别上进行恢复,这种方式没有数据类型的限制,可以保证两个数据库完全一致。Physical Standby数据库只能在Mount状态下进行恢复,也可以打开,但是只能以只读方式打开,并且打开时不能进行恢复操作。
Logical Standby使用的是Logminer技术(LSP),通过把日志内容还原成SQL语句,然后SQL引擎执行这些语句,Logical Standby不支持所有数据类型,可以在视图dba_logstdby_unsupported中查看不支持的数据类型。如果使用了这种数据类型,则不能保证数据完全一致。Logical Standby数据库可以在恢复的同时进行读写操作。
Physical Standby的SCN号和主库保持一致,而Logical Standby仅保持数据层面的一致。一般在应用过程中BUG会较多,建议使用Physical Standby。

根据发生时间划分

根据Redo Apply发生的时间又可以分成两种

一种是实时应用(Real-Time Apply),这种方式必须使用Standby Redo Log。每当日志被写入到Standby Redo Log时,就会触发恢复,使用这种方式的好处在于可以减少数据库切换的时间(Switchover或Failover),因为切换时间主要用在剩余日志内容的恢复上。
另一种是归档应用,这种方式是在Primary Database发生日志切换,触发了Standby Database的归档操作,归档完成后会触发恢复,这也是缺省的恢复方式。
如果是Physical Standby,可以使用下面的命令启用Real-Time:

 alter database recover managed standby database using current logfile;

如果是Logical Standby,可以使用下面的命令启用Real-Time:

 alter database start logical standby apply immediate;

查看是否使用Real-Time Apply:

select recovery_mode from v$archive_dest_status;

5、自动裂缝检测和解决

当Primary Database的某些日志没有成功发送到Standby Database,这时候发生了归档裂缝(Archive Gap)。
缺失的这些日志就是裂缝(Gap)。Data Guard能够自动检测,解决归档裂缝,不需要DBA的介入。这需要配置FAL_CLIENT,FAL_SERVER 这两个参数(FAL: Fetch Archive Log)。

从FAL 这个名字可以看出,这个过程是Standby Database主动发起的“取”日志的过程,Standby Database 就是FAL_CLIENT. 它是从FAL_SERVER中取这些Gap, 10g中,这个FAL_SERVER可以是Primary Database, 也可以是其他的Standby Database。
如:FAL_SERVER=‘PR1,ST1,ST2’;
FAL_CLIENT和FAL_SERVER两个参数都是Oracle Net Name。FAL_CLIENT 通过网络向FAL_SERVER发送请求,FAL_SERVER通过网络向FAL_CLIENT发送缺失的日志。 但是这两个连接不一定是一个连接。 因此FAL_CLIENT向FAL_SERVER发送请求时,会携带FAL_CLIENT参数值,用来告诉FAL_SERVER应该向哪里发送缺少的日志。 这个参数值也是一个Oracle Net Name,这个Name是在FAL_SERVER上定义的,用来指向FAL_CLIENT.

当然,除了自动地日志缺失解决,DBA 也可以手工解决。 具体操作步骤如下:

1) 查看是否有日志GAP: 
SQL> SELECT UNIQUE THREAD#, MAX(SEQUENCE#) OVER(PARTITION BY THREAD#) LAST FROM V$ARCHIVED_LOG; 
 
SQL> SELECT THREAD#, LOW_SEQUENCE#, HIGH_SEQUENCE# FROM V$ARCHIVE_GAP; 
2) 如果有,则拷贝过来
3) 手工的注册这些日志: 
SQL> ALTER DATABASE REGISTER LOGFILE '路径';

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1686433.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C# 正则表达式使用小计

此文档用于记录平时使用正则表达式的心得,不定期更新 基础 实例 替换实例一 //这里匹配以 “( 开头,以 )” 结尾的字符串 private static Regex REGEX_ARG_CONTENT new Regex("""(.*?)""");//此方法用于在匹配到的结果前添加字符…

TG5032CGN TCXO 超高稳定10pin端子型适用于汽车动力转向控制器

TG5032CGN TCXO / VC-TCXO是一款应用广泛的晶振,具有超高稳定性,CMOS输出和使用晶体基振的削波正弦波输出形式。且有低相位噪声优势,是温补晶体振荡器(TCXO)和压控晶体振荡器(VCXO)结合的产物,具有TCXO和VCXO的共同优点&#xff0…

微网群如何协调控制?基于目标级联法的微网群多主体分布式优化调度程序代码!

前言 微电网将分布式电源(distributed generation,DG)与负荷组成有机整体,通过控制策略降低了分布式电源直接并网对大电网的影响,是分布式电源友好并网的有效手段。随着微电网的不断发展,局部范围内的多个微电网互相联结形成微网…

学习记录16-反电动势

一、反电动势公式 在负载下反电势和端电压的关系式为:𝑈𝐼𝑅𝐿*(𝑑𝑖 / 𝑑𝑡)𝐸 E为线圈电动势、 𝜓 为磁链、f为频率、N…

大语言模型预训练新前沿:「最佳适配打包」重塑文档处理标准

源自:机器之心 “人工智能技术与咨询” 发布 声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们…

颠覆传统编码,零基础也能飞的工具!

YDUIbuilder以其低代码的设计理念,通过简单的拖拽操作,即使是编程新手也能快速构建出专业的用户界面。这不再是一个遥不可及的梦想,而是一个触手可及的现实。 组件化世界,创意无限:构建梦想中的界面 在YDUIbuilder的组…

java项目之人事系统源码(springboot+vue+mysql)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的人事系统。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 基于vue的人事系统的主要使用者…

软件无线电学习-第二代移动通信系统过程理解

本文知识内容摘自《软件无线电原理和应用》 无线通信领域让大家感受最深的是民用移动通信的快速发展。民用移动通信在短短的二十年时间里已发展了三代:20世纪80年代的模拟体制(TACS/AMPS)为第一代移动通信(简称1G);20世纪90年代的数字体制(GSMCDMATDMA)…

.NET快速实现网页数据抓取

网页数据抓取需求 本文我们以抓取博客园10天推荐排行榜第一页的文章标题、文章简介和文章地址为示例,并把抓取下来的数据保存到对应的txt文本中。 请求地址:https://www.cnblogs.com/aggsite/topdiggs 创建控制台应用 创建名为DotnetSpiderExercise的控…

呆马科技----构建智能可信的踏勘云平台

近年来,随着信息技术的快速发展,各个行业都在积极探索信息化的路径,以提升工作效率和服务质量。智慧踏勘云平台是基于区块链和大数据技术构建的全流程智慧可信踏勘解决平台。平台集远程视频、数据显示、工作调度、过程记录为一体,…

5.23 Linux中超时检测方式+模拟面试

1.IO多路复用的原理? IO多路复用使得一个或少量线程资源处理多个连接的IO事件的技术。对于要处理的多个阻塞的IO操作,建立集合并存储它们的文件描述符,利用单个阻塞函数去监控集合中文件描述符事件到达的情况,(如果到…

MQTT物联网关

在物联网(IoT)日益融入我们生活与工作的今天,如何高效、安全地实现设备间的信息交换成为了行业的关键议题。MQTT,作为轻量级的发布/订阅消息传输协议,凭借其高效性、实时性和可扩展性,在物联网领域占据了举…

解决配置动态刷新注解@RefreshScope导致定时任务注解@Scheduled失效问题

示例 1. 获取配置bean 注意使用配置动态刷新注解RefreshScope. Data RefreshScope Component ConfigurationProperties(prefix "test") public class TestProperties {private String filesPath;private String directoryCleanCron; } 2. 实现定时任务的代码 注意…

Unreal基础多线程及渲染多线程

基础多线程: UE4中的多线程模型主要基于FRunnable和FRunnableThread两个核心概念。其中,FRunnable定义了一个可以在线程上运行的对象,而FRunnableThread则提供了一个平台无关的线程对象抽象,负责驱动FRunnable对象的初始化、执行…

线程池(C++)

个人主页&#xff1a;Lei宝啊 愿所有美好如期而遇 线程池 实现线程类 #pragma once#include <pthread.h> #include <iostream> #include <vector> #include <string> #include <cstdlib> #include <cstring> #include <functional&…

AI大模型探索之路-实战篇4:DB-GPT数据应用开发框架调研实践

目录 前言一、DB-GPT总体概述二、DB-GPT关键特性1、私域问答&数据处理&RAG2、多数据源&GBI3、多模型管理4、自动化微调5、Data-Driven Multi-Agents&Plugins6、隐私安全 三、服务器资源准备1、创建实例2、打开jupyterLab 四、DB-GPT启动1、激活 conda 环境2、切…

【大比武07】人工智能技术赋能城建档案高质量发展

关注我们 - 数字罗塞塔计划 - # 大比武2024 本篇是参加“华夏伟业”杯第二届档案信息化公司业务与技术实力大比武&#xff08;简称“大比武 2024”&#xff09;的投稿文章&#xff0c;来自讯飞知喻&#xff08;安徽&#xff09;科技有限公司&#xff0c;作者&#xff1a;张海剑…

Flask 蓝图路由的模块化开发

基于 Flask 蓝图路由的模块化开发 1. 编程目标 为了提高Flask应用的可维护性和可扩展性&#xff0c;我们通过使用Flask的蓝图(Blueprint)功能&#xff0c;可以将不同的功能模块拆分到独立的文件中&#xff0c;方便后续的开发和维护。 2. 项目结构 项目结构树如下&#xff1…

基于Matlab实现声纹识别系统

欢迎大家点赞、收藏、关注、评论啦 &#xff0c;由于篇幅有限&#xff0c;只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 一、项目背景与意义 声纹识别&#xff0c;也称为说话人识别&#xff0c;是一种通过声音判别说话人身份的生物识别技…

高效爬取Reddit:C#与RestSharp的完美结合

介绍 在数据驱动的时代&#xff0c;网络爬虫已经成为获取网页数据的重要工具。Reddit&#xff0c;作为全球最大的社区平台之一&#xff0c;以其丰富的用户生成内容、广泛的讨论话题和实时的信息更新吸引了大量用户。对于研究人员和开发者而言&#xff0c;Reddit提供了宝贵的数…