【TDSQL】TCPMSS最大数据分段大小值不合理导致JAVA程序连接数据库异常案例

news2024/9/23 21:32:09

欢迎关注“数据库运维之道”公众号,一起学习数据库技术!

TDSQL核心架构原理解析下载链接:百度网盘 请输入提取码 提取码:vat5

DTC2024 数据技术嘉年华(演讲资料下载)DTC2024 数据技术嘉年华(演讲资料下载) - 墨天轮

海明威运动定律告诉我们,事物的变化往往在经历一定渐进发展后带来突变。技术的变革同样如此。今天我们惊艳于诸多数字化生活的时刻,殊不知在过去几年中,云计算、分布式数据库、中间件等国产基础技术已经过多年的自我打磨,逐渐成为新一代底层技术架构,并最终带来各行各业从底层到业务的彻底的数字化转型升级,以及更重要的新型业务形态的出现,成为新基建时代发展的基础驱动力量。本人也有幸参与多款分布式数据库(TDSQL、TiDB、HotDB)的运维工作,希望个人整理的知识点可以帮助大家提升数据库运维工作效率。本期将为大家分享《TCP MSS最大数据分段大小值不合理导致JAVA程序连接TDSQL数据库异常》的处置案例。

关键词:分布式数据库、TDSQL、LVS、proxy、TCPMSS

在TDSQL数据库集群上部署一套新的实例提供给业务系统使用。业务虚拟机通过Navicate客户端可以正常登录数据库并进行SQL查询,但是JAVA应用程序连接数据库会出现通讯连接失败情况。报错信息为:Communications link failure。TDSQL版本10.3.14.6.0,MySQL版本5.7.17。

1、开发人员反馈JAVA程序能够正常启动,但是在登录界面输入账号密码后,出现异常报错。查看JAVA程序后台日志,看到"Error querying database"和"Communication link failure"错误。如下图所示。

2、使用Navicate客户端可以正常登录数据库,并且SQL查询也可以正常返回结果。于是,让开发人员检查应用程序的连接池配置,各项参数设置均正常。

3、应用程序是通过域名来访问数据库,于是直接改为LVS地址来访问还会报错,因此可以排除域名解析。

4、检查PROXY的日志,未发现sql出现在interface日志中。

5、梳理生产环境的部署架构如下图所示,并初步推断问题可能在LVS或Proxy上面。

6、于是,登录LVS服务器进行网络抓包,并提给网络工程师分析。查看对应负载端口抓包信息,查看到大量重传记录。

tcpdump -i any -s 0 -C 100 -W 10 -w tcpq.cap port 负载端口

7、应用程序跳过LVS直接访问proxy地址后,应用程序没有再出现连接异常。此时基本定位为lvs发包失败,proxy未接到sql请求。

8、检查两台LVS路由信息(ipvsadm -ln),查看各个服务器的网卡mtu值,都是设置为1500。

9、MSS是TCP数据包每次能够传输的最大数据分段。为了达到最佳的传输效能TCP协议在建立连接的时候通常要协商双方的MSS值,这个值TCP协议在实现的时候往往用MTU值代替(需要减去IP数据包包头的大小20Bytes和TCP数据段的包头20Bytes),通讯双方会根据双方提供的MSS值的最小值确定为这次连接的最大MSS值。而一般以太网MTU都为1500,所以在以太网中,往往TCP MSS为1460。

10、由于lvs给包增加了20字节的ip头,MTU值大于1500,导致发包失败。

数据包流转过程:
client(mtu1500)->lvs的vip(mtu 1480)->lvs给包增加了20字节的ip头,通过lvs的真实ip(mtu1500)->proxy的真实ip(mtu1500)接收,通过proxy的vip(mtu1480)->client
1、第一步建立链接,client与lvs的vip之间的mss协商应为1440,clint的mss=1500-20-20=1460,lvs的vip的mss=1480-20-20=1440,两者协商后取最小值。
2、第二步建立链接,lvs真实ip与proxy的真实ip之间协商的mss应为1460,但是因为lvs给包增加了20字节的ip头,mtu=mss+20+20+20=1520大于proxy的真实ip的mtu1500,导致发包失败。

1、为了避免发包失败,在proxy服务器上手动设置mss的值为1440,并持久化到开机自启动中。

#iptables -A OUTPUT  -p tcp --tcp-flags ALL SYN,ACK -j TCPMSS--set-mss 1440

# iptables -L|grep TCP
TCPMSS     tcp  --  anywhere             anywhere             tcp flags:FIN,SYN,RST,PSH,ACK,URG/SYN,ACK TCPMSS set 1440

# echo "iptables -A OUTPUT  -p tcp --tcp-flags ALL SYN,ACK -j TCPMSS--set-mss 1440">>/etc/rc.local

2、在lvs机器上关闭小包合并,并持久化到开机自启动中。

# ethtool -K bond0 lro off gro off gso offtso off

# ethtool -k bond0|grep -i -E "tcp-segmentation-offload|generic-segmentation-offload|generic-receive-offload|large-receive-offload"
tcp-segmentation-offload: off
generic-segmentation-offload: off
generic-receive-offload: off
large-receive-offload: off

# echo "ethtool -K bond0 lro off grooff gso off tso off" >>/etc/rc.local

推荐阅读一:proxy 模块运维

proxy是TDSQL的核心组件之一,主要提供了sql转写、sql分发、权鉴、结果聚合、结果过滤等功能,对应的进程分别是mysql-proxy和router_update。其中mysql-proxy

是网关的主进程,负责处理用户的SQL请求。而router_update是网关的辅助进程,负责从决策集群(ZK)获取路由等信息,监听决策集群的变更信息,并实时更新相关路由信息。

进程启停命令:
su - tdsql
cd /data/tdsql_run/${PORT}/gateway/bin
./start.sh instance_${PORT}      #启动
./stop.sh instance_${PORT}       #停止
./restart.sh instance_${PORT}    #重启

推荐阅读二:lvs模块运维

LVS模块采取Lvs+Keepalived的方案为TDSQL的实例提供数据库负载均衡功能,其中:

lvsmanager:从Zookeeper(简称ZK)上拉取LVS的配置,并持久化到Keepalived的配置文件。

Keepalived:为LVS提供vip(虚拟IP)的容灾功能,检测proxy的健康状况,并且将vip的主备信息等上报到zk节点。

进程启停命令:
su - tdsql
cd /data/application/lvsmanager/bin
./startlvsmanager.sh ../conf/lvsmanager.xml     #启动
./stoplvsmanager.sh ../conf/lvsmanager.xml      #停止
./restartlvsmanager.sh ../conf/lvsmanager.xml   #重启

虚拟IP(VIP)部分配置
# cat VIP_Group1-虚拟端口.conf 
virtual_server 虚拟IP 虚拟端口{
      delay_loop 6 //健康检查的时间间隔
      lb_algo sed //负载均衡调度算法
      lb_kind TUN //LVS模式,DR或者TUN;当前默认为TUN模式,不建议修改。
      protocol TCP //网络协议

  1. 腾讯云私有云文档中心-腾讯云
  2. ​一文详解 LVS、Nginx 及 HAProxy 工作原理( 附大图 ) - 知乎

以上就是本期关于“TCP MSS最大数据分段大小值不合理导致JAVA程序连接TDSQL数据库异常”的处置案例。希望能给大家带来帮助。

欢迎关注“数据库运维之道”公众号,一起学习数据库技术!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1606552.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

生成人工智能体:人类行为的交互式模拟论文与源码架构解析(5)——可控评估端到端评估

最后完结篇,文末有测试中发现的有趣现象,并附上了相关资料链接~ 5.可控评估 分两个阶段评估生成代理。我们从一个更加严格控制的评估开始,单独评估代理的响应,以了解它们是否在狭义上定义的上下文中产生可信的行为。然后,在我们对代理社区进行为期两天的端到端分析中,我…

决策树分类器(保姆级教学) 定义+特性+原理及公式+鸢尾花分类经典问题示例(完整Python代码带详细注释、保姆级分部代码解释及结果说明、决策树可视化及解释)

文章目录 引言定义特性基本原理和公式理解信息增益(ID3算法)熵的定义条件熵信息增益的计算 基尼不纯度(CART算法)基尼不纯度的定义基尼不纯度的计算例子 实现步骤解决鸢尾花分类问题(机器学习入门中的经典案例Python代…

传感器融合 | 适用于自动驾驶场景的激光雷达传感器融合项目_将激光雷达的高分辨率成像+测量物体速度的能力相结合

项目应用场景 面向自动驾驶场景的激光雷达传感器融合,将激光雷达的高分辨率成像测量物体速度的能力相结合,项目是一个从多个传感器获取数据并将其组合起来的过程,可以更加好地进行环境感知。项目支持 ubuntu、mac 和 windows 平台。 项目效果…

在系统中设定延迟任务和定时任务

useradd easylee //设置名为easylee的新用户 passwd easylee //更改密码为easylee,输入两次即可 将root和easylee加入白名单,使系统中只有root用户和easylee用户可以执行延迟任务的设置。 建立任务并给权限 定时任务

vue 实现实时搜索文档关键字并高亮显示

最近接到的一个新需求:实时搜索文档关键字并高亮显示,听起来好难的样子,仔细分析起来其实也蛮简单的。 实现思路 通过 input 实现关键字的输入,监听关键字的变化,用正则表达式来匹配关键字,然后给关键字添…

视觉信息保真度VIF算法详细介绍

来源 算法核心思想来源该篇论文A VISUAL INFORMATION FIDELITY APPROACH TO VIDEO QUALITY ASSESSMENT;是2005年的一篇高引用文章; 是一种全参考的视频图像评价算法;在奈飞开源的视频质量评价工具vmaf中将其作为一个判断维度,具体关于vmaf介绍可以参考视频质量评价工具vmaf…

一文学会时序约束

主时钟约束命令/生成时钟约束命令IO输入输出延迟约束命令及效果最大最小延迟命令及作用多周期路径怎么约束什么情况设置伪路径时钟组设置的三个选项 如果不了解时序分析可以先看下下面这篇文章: 数字IC/FPGA——时序分析 目录 1.时钟约束(1)…

SRIO系列-仿真测试

一、前言 前两篇已经讲述了SRIO协议的概况,以及xilinx SRIO IP核的使用方式,已经在搭建工程的过程中时钟和复位的注意事项。 二、设计框图 整个框图也是按照之前的工程进行搭建,首先时SRIO_Channel,由SRIO IP核和时钟、复位模块…

【C++题解】1607. 两位数运算

问题:1607. 两位数运算 类型:基本运算、拆位求解 题目描述: 小丽在编程课上学会了拆位运算,她已经可以拆出一个两位整数的十位和个位了,她想知道这个整数的十位 / 个位的结果是多少,请编程帮她实现&#…

异地网络如何在线共享文件夹?

信息的传输和共享变得异常便利。而对于拥有异地办公或分布式团队的公司或组织来说,跨地域的文件共享变得尤为重要。在这个背景下,“异地网络在线共享文件夹”应运而生。 异地网络在线共享文件夹的意义 对于异地办公的团队来说,共享文件夹是一…

《Super Simple Skybox》天空盒 -- 创造绝美天空的神奇工具!限时免费!

《Super Simple Skybox》天空盒 -- 创造绝美天空的神奇工具!限时免费! 前言内容介绍资源特色动态,美丽的天空在几秒钟内即插即用 功能列表领取兑换码 前言 ^^在这个充满创意与想象的世界里,Unity 免费资源犹如一颗璀璨的明珠&…

信息系统项目管理师0055:优化和持续改进(4信息系统管理—4.1管理方法—4.1.5优化和持续改进)

点击查看专栏目录 文章目录 4.1.5优化和持续改进1.定义阶段2.度量阶段3.分析阶段4.改进/设计阶段5.控制/验证阶段4.1.5优化和持续改进 优化和持续改进是信息系统管理活动中的一个环节,良好的优化和持续改进管理活动能够有效保障信息系统的性能和可用性等,延长整体系统的有效使…

redis的数据结构报错

文章目录 redis的数据结构报错Redis使用LocalDateTime报错问题 redis的数据结构报错 Redis使用LocalDateTime报错问题 SpringBoot整合Redis时,使用LocalDate以下报错 org.springframework.data.redis.serializer.SerializationException: Could not read JSON: C…

统一SQL-支持cast函数

统一SQL介绍 https://www.light-pg.com/docs/LTSQL/current/index.html 源和目标 源数据库:Oracle 目标数据库:Postgresql,TDSQL-MySQL,达梦8,LightDB-Oracle 操作目标 在Oracle中,cast函数允许将一种…

CSS:filter(滤镜)属性

用途 可以用于img标签,div标签等 图像,背景,边框的调整 常用属性 1. 灰度 grayscale(),默认是0,100%就是黑白 2. blux 给图像设置高斯模糊的程度,radius值设定高斯模糊的程序,表示像素点…

android studio gradle 下载不下来的问题

有时候由于网络问题,会发现 android-studio 或 idea 下载不懂 gradle,可以修改 gradle-wrapper.properties 配置文件中的 distributionUrl 选项来解决这个问题。 distributionUrlhttps\://mirrors.cloud.tencent.com/gradle/gradle-5.1.1-all.zip 这个选…

遥感图像分割 | 基于一种类似UNet的Transformer算法实现遥感城市场景图像的语义分割_适用于卫星图像+航空图像+无人机图像

项目应用场景 面向遥感城市场景图像语义分割场景,项目采用类似 UNet 的 Transformer 深度学习算法来实现,项目适用于卫星图像、航空图像、无人机图像等。 项目效果 项目细节 > 具体参见项目 README.md (1) 安装依赖 conda create -n airs python3.8…

常用的7个免费ChatGPT网站

💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

OpenCV从入门到精通实战(六)——多目标追踪

基于原生的追踪 使用OpenCV库实现基于视频的对象追踪。通过以下步骤和Python代码,您将能够选择不同的追踪器,并对视频中的对象进行实时追踪。 步骤 1: 导入必要的库 首先,我们需要导入一些必要的Python库,包括argparse、time、…

Debian12 中重新安装MSSQL 并指定服务器、数据库、数据表字段的字符排序规则和默认语言等参数

在 Linux 上配置 SQL Server 设置 - SQL Server | Microsoft Learn 零、查看sql server 服务器支持的字符排序规则 SELECT Name from sys.fn_helpcollations() where name Like Chinese% go------ Chinese_PRC_CI_AI Chinese_PRC_CI_AI_WS Chinese_PRC_CI_AI_KS Chinese_PRC_…