SQL ServerAlways On 可用性组配置失败

news2025/4/6 13:00:40

问题现象
配置 Always On 可用性组时,报错 “无法将数据库加入可用性组”(错误 41158),或提示 “WSFC 群集资源无法联机”(错误 19471)。


快速诊断
  1. 验证 WSFC 群集状态

    # 检查群集节点状态(需在故障转移群集管理器中运行)
    Get-ClusterNode | Select-Object Name, State
    # 检查群集网络通信
    Test-Cluster -Node "Node1", "Node2" -Include "Network"
    • 正常状态:所有节点状态为 Up,网络延迟 < 1ms。

  2. 检查数据库同步条件

    -- 确保数据库处于完整恢复模式且已备份
    SELECT name, recovery_model_desc, log_reuse_wait_desc 
    FROM sys.databases 
    WHERE name = 'MyDB';
  3. 排查端点配置

    -- 检查数据库镜像端点状态
    SELECT name, role_desc, state_desc 
    FROM sys.database_mirroring_endpoints;

解决方案
步骤 1:修复 WSFC 群集配置
  1. 重新验证群集配置

    # 运行群集验证工具
    Test-Cluster -Node Node1, Node2 -Include "Storage", "Inventory", "Network"
    • 修复所有验证报告中标记的警告或错误(如存储路径权限、网络隔离)。

  2. 重启群集服务

    Stop-Cluster -Cluster SQLCluster -Force
    Start-Cluster -Cluster SQLCluster
步骤 2:配置 Always On 可用性组
  1. 启用 Always On 功能

    -- 启用 Always On 可用性组
    EXEC sys.sp_configure 'hadr enabled', 1;
    RECONFIGURE;
    • 重启 SQL Server 实例以生效。

  2. 创建可用性组端点

    CREATE ENDPOINT HadrEndpoint 
    STATE = STARTED
    AS TCP (LISTENER_PORT = 5022)
    FOR DATABASE_MIRRORING (ROLE = ALL);
  3. 初始化可用性组

    -- 通过向导或脚本创建可用性组
    CREATE AVAILABILITY GROUP AG_MyDB
    WITH (
        AUTOMATED_BACKUP_PREFERENCE = PRIMARY,
        FAILURE_CONDITION_LEVEL = 3
    )
    FOR DATABASE MyDB
    REPLICA ON 
        'Node1' WITH (ENDPOINT_URL = 'TCP://Node1:5022', FAILOVER_MODE = AUTOMATIC),
        'Node2' WITH (ENDPOINT_URL = 'TCP://Node2:5022', FAILOVER_MODE = AUTOMATIC);
步骤 3:同步数据库并验证
  1. 备份与还原数据库

    -- 主节点执行完整备份
    BACKUP DATABASE MyDB TO DISK = '\\SharedPath\MyDB.bak' WITH INIT;
    -- 辅助节点还原(需指定 NORECOVERY)
    RESTORE DATABASE MyDB FROM DISK = '\\SharedPath\MyDB.bak' WITH NORECOVERY;
  2. 将数据库加入可用性组

    ALTER AVAILABILITY GROUP AG_MyDB ADD DATABASE MyDB;

验证与日志分析
  1. 检查可用性组状态

    SELECT 
        ag.name AS AGName,
        ar.replica_server_name AS Replica,
        drs.database_id,
        drs.synchronization_state_desc AS SyncState
    FROM sys.availability_groups ag
    JOIN sys.availability_replicas ar ON ag.group_id = ar.group_id
    JOIN sys.dm_hadr_database_replica_states drs ON ar.replica_id = drs.replica_id;
  2. 分析错误日志

    • 群集日志路径

      C:\Windows\Cluster\Reports\ValidationReport.html
    • SQL Server 错误日志

      C:\Program Files\Microsoft SQL Server\MSSQL16.MSSQLSERVER\MSSQL\Log\ERRORLOG
    • 搜索关键词 HadrTransportManager::HandleSecEnvError(安全通信失败)或 Failed to join the database


扩展场景:跨子网延迟问题
  • 错误示例The connection timeout period elapsed

  • 解决方案

    1. 调整可用性组超时设置

      ALTER AVAILABILITY GROUP AG_MyDB 
      SET (HEALTH_CHECK_TIMEOUT = 60000);  -- 单位:毫秒
    2. 配置多子网侦听器

      ALTER AVAILABILITY GROUP AG_MyDB 
      MODIFY LISTENER 'AG_Listener' (
          ADD IP ('192.168.1.100/24', '255.255.255.0'),
          ADD IP ('10.0.0.100/24', '255.255.255.0')
      );

安全加固建议
  1. 启用传输加密

    ALTER ENDPOINT HadrEndpoint 
    FOR DATABASE_MIRRORING (AUTHENTICATION = CERTIFICATE DBMirrorCert);
  2. 限制端点访问

    New-NetFirewallRule -DisplayName "HADR-Port" -Direction Inbound -Protocol TCP -LocalPort 5022 -RemoteAddress 192.168.1.0/24 -Action Allow

通过以上步骤,可解决 Always On 可用性组配置中的典型问题。若部署在云环境(如 Azure VM),需确保负载均衡器规则允许 HADR 端口(5022)通信,并配置适当的探测机制。生产环境中建议定期执行故障转移演练并监控同步延迟。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2329239.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于Spark的哔哩哔哩舆情数据分析系统

【Spark】基于Spark的哔哩哔哩舆情数据分析系统 &#xff08;完整系统源码开发笔记详细部署教程&#xff09;✅ 目录 一、项目简介二、项目界面展示三、项目视频展示 一、项目简介 本项目基于Python和Django框架进行开发&#xff0c;为了便于广大用户针对舆情进行个性化分析处…

【Linux】日志模块实现详解

&#x1f4e2;博客主页&#xff1a;https://blog.csdn.net/2301_779549673 &#x1f4e2;博客仓库&#xff1a;https://gitee.com/JohnKingW/linux_test/tree/master/lesson &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指正&#xff01; &…

Java基础:面向对象高级(四)

内部类&#xff08;类中五大成分之一&#xff09; 四种形式 成员内部类【了解】 静态内部类【了解】 局部内部类【了解】 匿名内部类【重点】 枚举 泛型 什么是泛型 泛型类-模拟ArrayList 泛型接口-操作学生&#xff0c;老师增删改查 泛型方法 泛型擦除和注意事项

easy-poi 一对多导出

1. 需求&#xff1a; 某一列上下两行单元格A,B值一样且这两个单元格&#xff0c; 前面所有列对应单元格值一样的话&#xff0c; 就对A,B 两个单元格进行纵向合并单元格 1. 核心思路&#xff1a; 先对数据集的国家&#xff0c;省份&#xff0c;城市...... id 身份证进行排序…

python通过调用海康SDK打开工业相机(全流程)

首先打开海康机器人-机器视觉-下载中心 下载最新版的 MVS 安装后打开目录找到 ...\MVS\Development\Samples\Python 将MvImport内所有文件拷贝至工作目录 然后到 C:\Program Files (x86)\Common Files\MVS\Runtime 找到适合自己系统的版本&#xff0c;将整个文件夹拷贝至工…

manim,制作专业的数学公式动画

manim是一个Python第三方库,全称是mathematical animation engine(数学动画引擎)。manim用于解说线性代数、微积分、神经网络、黎曼猜想、傅里叶变换以及四元数等数学概念。 manim使你能够以编程的方式创建精确的数学图形、动画和场景。与传统的几何画板等绘图软件不同,man…

小刚说C语言刷题——第15讲 多分支结构

1.多分支结构 所谓多分支结构是指在选择的时候有多种选择。根据条件满足哪个分支&#xff0c;就走对应分支的语句。 2.语法格式 if(条件1) 语句1; else if(条件2) 语句2; else if(条件3) 语句3; ....... else 语句n; 3.示例代码 从键盘输入三条边的长度&#xff0c;…

[ctfshow web入门] web6

前置知识 入口点(目录)爆破 还记得之前说过网站的入口的吗&#xff0c;我们输入url/xxx&#xff0c;其中如果url/xxx存在&#xff0c;那么访问成功&#xff0c;证明存在这样一个入口点&#xff1b;如果访问失败则证明不存在此入口点。所以我们可以通过遍历url/xxx&#xff0c;…

简单程序语言理论与编译技术·22 实现一个从AST到RISCV的编译器

本文是记录专业课“程序语言理论与编译技术”的部分笔记。 LECTURE 22&#xff08;实现一个从AST到RISCV的编译器&#xff09; 一、问题分析 1、完整的编译器&#xff08;如LLVM&#xff09;需先完成AST到IR的转换&#xff0c;并进行代码优化&#xff0c;再到汇编&#xff0…

lua和C的交互

1.C调用lua例子 #include <iostream> #include <lua.hpp>int main() {//用于创建一个新的lua虚拟机lua_State* L luaL_newstate();luaL_openlibs(L);//打开标准库/*if (luaL_dofile(L, "test.lua") ! LUA_OK) {std::cerr << "Lua error: &…

Css:如何解决绝对定位子元素内容被父级元素overflow:hidden属性剪裁

一、问题描述 今天小伙伴提了一个bug&#xff0c;在点击列表项的“…”按钮应该出现的悬浮菜单显示不完整&#xff1a; 二、问题排查 一般这种问题&#xff0c;是由于悬浮菜单采用的是绝对定位&#xff0c;而父级采用了overflow:hidden属性。但需要注意的是&#xff0c;这里的…

RoMo: Robust Motion Segmentation Improves Structure from Motion

前言 看起来像是一篇投稿CVPR的文章&#xff0c;不知道被哪个瞎眼审稿人拒了。同期还有一篇CVPR被接收的工作Segment Any Motion in Videos&#xff0c;看起来不如这篇直白&#xff08;也可能是因为我先看过spotlesssplats的缘故&#xff09;&#xff0c;后面也应该一并介绍了…

MCP 极简入门 - 三分钟 Cline + Smithery 运行 time 服务

文章目录 一、&#x1f680; 初识Smithery&#xff1a;AI服务的新大陆找到心仪的服务 二、Cline 编辑配置文件&#x1f527;1、打开配置文件2. 添加Time Server配置3. 验证配置效果 三、&#x1f4ac; 实战对话&#xff1a;让AI告诉你时间四、服务管理小技巧&#x1f504;&…

基本机动飞行性能

机动飞行时描述飞机在给定构型和发动机工作状态下改变飞行速度、飞行高度和飞行方向的能力 1. 水平加&#xff08;减&#xff09;速 水平加&#xff08;减&#xff09;速性能反映飞机在水平面内改变直线飞行速度的能力。描述水平加&#xff08;减&#xff09;速性能的参数包括…

【Linux】进程间通信、匿名管道、进程池

一.什么是通信 进程间通信(Inter-Process Communication&#xff0c;IPC),是指在操作系统中&#xff0c;不同进程之间进行数据交换和同步的机制。由于每个进程通常拥有独立的内存空间&#xff0c;进程间无法直接访问对方的内存&#xff0c;因此需要通过特定的机制来实现通信和…

【MATLAB定位例程】TDOA(到达时间差)的chan-tylor,三维环境,附完整代码

该代码实现了基于三维空间的动态目标TDOA定位,结合了Chan算法(解析解)与Taylor级数展开法(迭代优化)的双重优势。 文章目录 运行结果MATLAB代码代码讲解代码功能概述核心算法原理代码结构解析可视化与结果分析运行结果 定位示意图: 三轴状态曲线: 三轴误差曲线: MA…

数字化转型中的开源AI智能客服与S2B2C商城小程序的融合创新

摘要 数字经济时代&#xff0c;企业需通过技术重构用户交互与供应链体系。本文以“开源AI智能客服”“AI智能名片”及“S2B2C商城小程序”为核心&#xff0c;研究三者如何通过技术协同与场景化应用实现企业营销、客户服务与供应链管理的智能化升级。通过案例分析、技术架构设…

重生之我是去噪高手——diffusion model

diffusion model是如何运作的&#xff1f; 想象一下&#xff0c;你有一张清晰的图片。扩散模型的核心思想分为两个过程&#xff1a; 前向过程&#xff08;Forward Process / Diffusion Process&#xff09;&#xff1a;逐步加噪反向过程&#xff08;Reverse Process / Denois…

【C#】.net core 6.0 依赖注入常见问题之一,在构造函数使用的类,都需要注入到容器里,否则会提示如下报错,让DeepSeek找找原因,看看效果

&#x1f339;欢迎来到《小5讲堂》&#x1f339; &#x1f339;这是《C#》系列文章&#xff0c;每篇文章将以博主理解的角度展开讲解。&#x1f339; &#x1f339;温馨提示&#xff1a;博主能力有限&#xff0c;理解水平有限&#xff0c;若有不对之处望指正&#xff01;&#…

论文阅读笔记——RDT-1B: A DIFFUSION FOUNDATION MODEL FOR BIMANUAL MANIPULATION

RDT-1B 论文 模型表达与泛化能力&#xff1a;由于双臂操作中动作空间维度是单臂空间的两倍&#xff0c;传统方法难以建模其多模态分布。 数据&#xff1a;双臂数据少且不同机器人的物理结构和动作空间差异&#xff08;如关节数、运动范围&#xff09;导致数据分布不一致&#x…