故障描述:
服务器ocmpgdbprod1,是流复制主节点,它的从节点是ocmpgdbprod2,两个节点的Postgresql数据库版本都是PostgreSQL 11.6,主节点ocmpgdbprod1配置了pg_wal归档,从节点ocmpgdbprod2没有配置pg_wal归档,ocmpgdbprod1配置的pg_wal归档路径突然连不上了导致pg_wal归档失败从而引发pg_wal日志堆积越来越多最终导致磁盘爆满然后Postgresql服务自动关闭。
在pg_wal归档路径继续无法连上的情况下,再次尝试启动Postgresql,启动postgresql后突然发现很多pg_wal日志在没有归档的情况下,我也没手工归档或删除的情况下,居然突然自动消失了很多,百思不得其解,个人多年DBA经验潜意识的认识到这种不符合逻辑的情况,一般都是bug,一查资料果然是bug,见postgresql官方文档https://www.postgresql.org/message-id/flat/20200407171736.61906608%40firost#64fa6791cbd45784cf3e8fb0e5ec0c0e,该bug在11.8版本修复了https://www.postgresql.org/about/news/postgresql-123-118-1013-9618-and-9522-released-2038/