- 专栏内容:postgresql内核源码分析
- 个人主页:我的主页
- 座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物.
目录
前言
概述
原理机制
关键流程
备节点启动
walreceiver启动的时机
结尾
前言
本文是基于postgresql 15的代码进行分析解读,演示是在centos8系统上进行。
概述
hot-standby模式是postgresql提供的一种高可用方案,可以通过一主一备,或一主多备,以及一主多级级联备来达到数据和业务的高可用,备节点也可以进行只读业务,所以对只读业务的性能也会有很好的提升。
通过hot-standby模式也可以搭建容灾部署,达到多地多中心的效果。
原理机制
先来看下hot-standby如何搭建,要经过以下步骤:
(1)当然主节点要设置wal_level,pg_hba中设置访问权限,walsender要和备节点数量有关;
(2)通过pg_basebackup备份主节点的当前数据,此份数据就可以作为备节点启动,参数控制单独生成wal还是放在数据目录,带有-R时还会生成recovery信息;
(3)备节点设置standby=on,同时设置主节点的连接访问信息;这个可以在pg_basebackup时通过参数一次性搞定;
(4)启动备节点,此时主节点修改的数据就在备节点上看到。
那么,这是如何实现的呢?
我们通过以下原理介绍来回答这些问题。
我们查看主备后台进程,会发现几个平常看不到的进程信息
[senllang@localhost cbase]$ ps -ef|grep postgres
senllang 1440923 1 0 Apr23 ? 00:00:00 /opt/postgres/bin/postgres -D pgtest -p 8889
senllang 1440924 1440923 0 Apr23 ? 00:00:10 postgres: checkpointer
senllang 1440925 1440923 0 Apr23 ? 00:00:28 postgres: background writer
senllang 1441187 1440923 0 Apr23 ? 00:00:05 postgres: walwriter
senllang 1441188 1440923 0 Apr23 ? 00:00:00 postgres: autovacuum launcher
senllang 1441189 1440923 0 Apr23 ? 00:00:00 postgres: logical replication launcher
senllang 1441398 1 0 Apr23 ? 00:00:00 /opt/postgres/bin/postgres -D standby -p 8888
senllang 1441399 1441398 0 Apr23 ? 00:00:16 postgres: checkpointer
senllang 1441400 1441398 0 Apr23 ? 00:00:21 postgres: background writer
senllang 1441401 1441398 0 Apr23 ? 00:06:38 postgres: startup recovering 00000002000000060000001C
senllang 1531801 3811240 0 Apr24 pts/3 00:00:00 /opt/postgres/bin/psql -d postgres -p 8889 -h 127.0.0.1
senllang 1531920 1441398 0 Apr24 ? 00:00:02 postgres: walreceiver streaming 6/1C48E758
senllang 1531922 1440923 0 Apr24 ? 00:00:01 postgres: walsender senllang 127.0.0.1(49266) streaming 6/1C48E758
主节点的端口为8889,对应的postmaster进程号为1440923 ,主节点下多了一个walsender 进程;
备节点的端口号为8888,对应的postmaster进程号为1441398 ,备节点下有两个进程startup ,walreceiver 显示在处理wal;
大家此时可以猜到主节点的变化是通过walsender发送到备节点的walreiver,然后由startup进程进行recovering,也就是redo,这样就可以在备节点看到和主节点一样的变化了。
主要流程如下图所示:
关键流程
-
备节点启动
standby模式启动的条件,
首先看standby.signal;
其次检查数据备份状态,有两种情况下认为是可以的;
1、有label文件的话就可以启用;
2、如果有recovery.signal,同时control文件中,数据有备份状态或者是正常停止状态的就可以启用;
-
walreceiver启动的时机
walreceiver是备节点在以standby启动后,从WAL源读取WAL时,首次会给postmaster发信号启动receiver。
walreceive进程启动详细流程:
(1)在启动时调用流程
如果是备节点启动,在startup中会请求启动walreceiver,调用关系为
StartupXLOG
->PerformWalRecovery
->ReadRecord
->XLogPrefetcherReadRecord
->lrq_complete_lsn
->lrq_prefetch
->XLogPrefetcherNextBlock
->XLogReadAhead
->XLogDecodeNextRecord
->ReadPageInternal
->XLogPageRead
->WaitForWALToBecomeAvailable
在WaitForWALToBecomeAvailable会选择恢复的来源,当恢复来源为XLOG_FROM_STREAM时,会检查walreceive以及主节点的连接信息,然后向postmaster发送启动walreceive的信号。
lrq_*提供了一组函数处理LsnReadQueue,在读取WAL完成WAL的加载获取。
(2)postmaster在信号处理时,设置启动标志,在serverloop时启动进程;
结尾
作者邮箱:study@senllang.onaliyun.com
如有错误或者疏漏欢迎指出,互相学习。
注:未经同意,不得转载!