Linux之Tcp粘包笔记

news2025/1/28 1:06:48

目录

一.网络传输四层模型

二.数据传输中数据包传输的两个限制概念

 三.数据传输的中粘包问题

四.数据组装的原因

Nagle算法原理:

五.关闭Nagle优化处理粘包问题吗?

六.粘包处理方法

a.设置消息边界:

b.定义消息长度:

七.UDP是否会出现粘包

a.IP数据报文格式

 b.UDP数据报文格式

c.tcp数据报文格式

八.IP层网络层是否会产生粘包

九总结


一.网络传输四层模型

在网络传输的四层模型中:网络层接口(数据链路层)->网络层->传输层->应用层。通过这四层模型传递,进行数据传输。如下图:

发送方传递消息,经过每一层都添加对应模型的包头,在传递下一等模型,接收方接收到通过层层剥离每一层的包头,最后就得到对应的消息。

二.数据传输中数据包传输的两个限制概念

MTU:最大传输单元(这个由网络接口层决定,最大为1500字节)。

MSS:最大传输报文(表示每次传输的报文大小)表示tcp用来限制应用层每次最大发送的报文长度。

两者关系: MTU = MSS + IP(头部,20字节) + TCP(头部,20字节)

例如:如果一个报文长度< 1500,那么一次就可以发送完成。> 1500 的报文传输就需要进行分片传输。比如,2000长度的数据包,第一个分包:1460,第二个分包:540(剔除ip+tcp包头各占20个字节)

如下图,MTU跟MSS关系图解:

 三.数据传输的中粘包问题

      针对粘包的产生,产生在TCP(字节流传输),例如:a给b发送一条消息,HelloWorld。可是因为传输过程中,b接受到的信息:HelloW ,orld这样b接收到的信息就变了意思。为什么会产生此种情况。就是因为所说的粘贴包导致。

   原因:TCP传输按照字节流传输(传输的就是二进制的数据流),在下层发送的时候,可能会被切片并且重新组装,最后再发送至接收者的缓冲区,而接收端未能正确的还原对应的数据流导致。这种情况的粘包问题主要是出在了开发者对tcp数据字流的处理上。并非tcp传输方式自身会产生粘包,这个才是出现粘包的实质原因。

四.数据组装的原因

        因为受限于MTU跟MSS的报文传输限制,当要传输一个很大的报文时,就需要对该报文进行分割,将其分割成若干,依次通过限制的传输通道,接收方收到后,再将收到的分割包重新组装起来,还原发送方的数据。另外在Tcp的传输方式中还存在一个组装的情况。比如,发送两个比较小的数据报文(<MSS),这样的发送方式比较比较浪费资源。所以TCP中设计了优化算法,Nagle算法进行优化。

Nagle算法原理:

  a.在发送一个数据包如果长度达到MSS(or含有FIN的数据包),那么就立刻发送该数据包。如果当前数据包msg1<MSS,那么就会等到下一个数据包msg2到来,如果该msg1 + msg2 > MSS,那么就会让将msg2进行拆分发送。

  b.该算法每次发送数据包,(设置了一个超时等待机制,一般是200ms),第一个包长度没达到MSS,就会进行一个超时等待第二个包来,如果等待第二个包超时还没来,则立刻发送第一个数据包。

c.如下图解:

d.m1 < MSS,此时m2来了,但是len(m1+ m2) > MSS,在Nagle算法开启情况,会将m2进行拆分,m2-1,m2-2,此时len(m1 + m2-1)= MSS,将该两包进行组装并且立刻发送出去。而m2-2,会重复前面的流程等待(200ms),以此类推,如果超时还没等到包来,就立刻将当前包发送出去。

e.上图解释明确颜色表述,但实际存储的都是为二进制数据,如果接受者把m1+ m2-1,当成一个包来处理,就会造成不明消息,该情况就是粘包情况。

五.关闭Nagle优化处理粘包问题吗?

    a.Nagle算法优化了资源的浪费情况,但是带来粘包问题。另外超时等待机制也是一个很大的缺陷问题,比如当下的游戏场景,正在打游戏,因为该算法的超时等待,导致一个数据包延时到来,就会造成游戏画面卡顿。通常使用中,都会关闭该算法优化。TCP_NODELAY = 1(Nagle关闭)

    b.即便关闭了该算法的优化,是不是就不会产生粘包情况?答案是否定的。仍旧会产生粘包问题。如下图:

如图,当m1消息到来时,直接取走了,消息正常还原。然后后续有消息来了,发送到了接受方的缓冲区,因应用层未能及时读走,下一个数据包也发送到了接受方的缓冲期如上图m2m3, 此时应用层一次将所有的数据读取了,导致数据混乱,从而导致就出现了粘包问题,

六.粘包处理方法

       粘包的问题主要是字节流传输中未能定义具体的消息边界导致。换句话说就是开发者发送数据的问题导致。如下介绍几种方法:

a.设置消息边界:

        给消息定义边界头跟边界尾巴,消息结构如下:

    |消息头|消息体|消息尾|

    |header|body| body_tail|

 但是a中存在一个问题,如果消息内容中存在跟头or尾中一样的标志,也会出现问题,处理该问题,可采用crc校验和添加来处理,如下图解:

        校验和:对整个消息生成的校验值

发送方通过对消息设置对应的校验和,接收方收到消息后,校验确保是发送方发送的完整数据。

b.定义消息长度:

        利用消息长度,应用层再度读取消息的按照消息长度读取正确的消息内容,跟http中的Content-Length表示传输的数据长度蕾丝。该种方法,也可结合a中的标志,再加上消息长度,就更加的能确保消息的读取的正确性。

结构如下:

七.UDP是否会出现粘包

       首先UDP的发送方式,使用的是数据报文方式,每次发送的数据都是一整个数据报文。无论应用层每次丢给UDP的报文多长,都会原样发送出去。这是跟tcp按照字节流发送的差异性。另外如果UDP的数据太大的话,也是会进行分片的,只不过该分片在IP层面,即便在应用层面,也不会像tcp那样分不清啥时候会结束。这就是udp跟tcp两者的区别。例如发送端发送了10次,接受端接收10次,发多少,接收多少,确保每次一完成的数据包就好了。

a.IP数据报文格式

 上图中有个16位的总长度,表明Ip包的总长度m。

 b.UDP数据报文格式

 如上图,UDP报文头有个16位的UDP长度表示n。应用层可根据该字段,读取对应大小的UDP报文。故而UDP不会产生粘包问题。另外如果不存在长度n,那么通过ip层也能够知道udp数据报文长度。计算方式: UDP包长度 = IP包总长度 - IP包头部 - UDP包头部。有个问题,这个16位的n字段是否多余的。如下答案:

c.tcp数据报文格式

 如上图tcp的报文结构中没有存储数据包的长度,但是依旧能通过如下方式计算:

tcp包长度 = IP包长度 - IP包头长度 - TCP包长度,如下图:

上面说UDP数据包头中的16位长度是否多余呢?答案否定的。如下解释:Tcp-Ip卷2中解释说是用于计算校验和,并且说UDP底层可能用的不是Ip协议,如果是其他网络类型,那么就不能计算UDP包长度了。但是还有一种解释,根据某位大佬的讲解,因为IP层是网络层协议,而UDP是传输层协议,当数据传输层,此时IP层头部已经被剥离了,此时如果UDP没有自身16位的长度,是无法计算出数据部分长度的。所有该解释感觉比较更切近点。当前卷中的解释,可能以后出现新协议作网络层处理,也是可能的。敬请期待中。。。还有,这个n跟tcp中应用层定义对应数据包长度字段是一个道理,用来确定包长度,防止粘包发生。

八.IP层网络层是否会产生粘包

  IP层传输也会对大包进行分包处理的,那么是否会产生粘包呢?

  答案是不会产生粘包的。这个前面说了,粘包的原因是使用者无法正确区分消息边界导致的。如下图所示:

整个数据包传输过程,从发送者网络层到接受者网络层,消息太长,超过MTU,会把消息分N个切片,并且每个切片会携带自身在整包的位置偏转量(offset)以及相同的头部信息。当数据包到达接受者的网络层,会将数据包重新组装起来。(过程是申请一个ip结构,将所有的分片包按照偏转量放置在各自的位置)等所有数据包组装完成,再即将数据包推到传输层。后面的处理,就是如上解释的是否粘包问题以及相关的处理。另外有关IP层分片请见如下博文,上图来自博主的下述文章:网络层协议之IP数据包层分片随笔_ip数据报分片计算-CSDN博客

九总结

         粘包的问题归根结底是开发者,未能正确区分消息边界导致,跟协议并无多大关系。

        a.TCP无论发送送什么,都是字节流发送,可能当前的字节流存在上次数据发送的内容,(就是粘包),只要使用消息边界确认就可以避免粘包。

        b.TCP有Nagle算法会导致粘包问题,但是关闭该算法并不解决粘包问题。

        c.UDP基于数据报文传输,不会产生粘包问题。

        d.IP层也会进行包分片,但仅仅是网络进行传输,并不关心数据包内容是什么,所以不会有粘包问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2283056.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

22_解析XML配置文件_List列表

解析XML文件 需要先 1.【加载XML文件】 而 【加载XML】文件有两种方式 【第一种 —— 使用Unity资源系统加载文件】 TextAsset xml Resources.Load<TextAsset>(filePath); XmlDocument doc new XmlDocument(); doc.LoadXml(xml.text); 【第二种 —— 在C#文件IO…

数据结构 链表2

目录 前言&#xff1a; 一&#xff0c;反转一个链表(迭代) 二&#xff0c;打印一个链表&#xff08;递归&#xff09; 三&#xff0c;反转一个链表(递归) 四&#xff0c;双向链表 总结 前言&#xff1a; 我们根据 [文章 链表1] 可以知道链表相比较于数组的优缺点和计算机…

Linux查看服务器的内外网地址

目录&#xff1a; 1、内网地址2、外网地址3、ping时显示地址与真实不一致 1、内网地址 ifconfig2、外网地址 curl ifconfig.me3、ping时显示地址与真实不一致 原因是dns缓存导致的&#xff0c;ping这种方法也是不准确的&#xff0c;有弊端不建议使用&#xff0c;只适用于测试…

【kong gateway】5分钟快速上手kong gateway

kong gateway的请求响应示意图 安装 下载对应的docker 镜像 可以直接使用docker pull命令拉取&#xff0c;也可以从以下地址下载&#xff1a;kong gateway 3.9.0.0 docker 镜像 https://download.csdn.net/download/zhangshenglu1/90307400&#xff0c; postgres-13.tar http…

缓存商品、购物车(day07)

缓存菜品 问题说明 问题说明&#xff1a;用户端小程序展示的菜品数据都是通过查询数据库获得&#xff0c;如果用户端访问量比较大&#xff0c;数据库访问压力随之增大。 结果&#xff1a; 系统响应慢、用户体验差 实现思路 通过Redis来缓存菜品数据&#xff0c;减少数据库查询…

Langchain+讯飞星火大模型Spark Max调用

1、安装langchain #安装langchain环境 pip install langchain0.3.3 openai -i https://mirrors.aliyun.com/pypi/simple #灵积模型服务 pip install dashscope -i https://mirrors.aliyun.com/pypi/simple #安装第三方集成,就是各种大语言模型 pip install langchain-comm…

八股学习 微服务篇

微服务篇 常见面试内容Spring Cloud 常见组件注册中心Ribbon负载均衡策略服务雪崩 常见面试内容 Spring Cloud 常见组件 Spring Cloud有5个常见组件&#xff1a; Eureka/Nacos:注册中心&#xff1b;Ribbon:负载均衡&#xff1b;Feign:远程调用&#xff1b;Hystrix/Sentinel:服…

【xcode 16.2】升级xcode后mac端flutter版的sentry报错

sentry_flutter 7.11.0 报错 3 errors in SentryCrashMonitor_CPPException with the errors No type named terminate_handler in namespace std (line 60) and No member named set_terminate in namespace std 替换sentry_flutter版本为&#xff1a; 8.3.0 从而保证oc的…

electron打包客户端在rk3588上支持h265硬解

目录 前言 chromium是如何支持h265硬解 electron/chromium第一次编译 electron/chromium第二次编译 前言 我们的客户端程序是用electron打包的前端程序&#xff0c;其在rk3588主机上的linux环境运行。之前使用客户端查看h264编码的视频直播是没有问题的&#xff0c;但视频源…

基于物联网的风机故障检测装置的设计与实现

1 系统总体设计方案 通过对风机故障检测装置的设计与实现的需求、可行性进行分析&#xff0c;本设计风机故障检测装置的设计与实现的系统总体架构设计如图2-1所示&#xff0c;系统风机故障检测装置采用STM32F103单片机作为控制器&#xff0c;并通过DS18B20温度传感器、ACS712电…

为什么IDEA提示不推荐@Autowired❓️如果使用@Resource呢❓️

前言 在使用 Spring 框架时&#xff0c;依赖注入&#xff08;DI&#xff09;是一个非常重要的概念。通过注解&#xff0c;我们可以方便地将类的实例注入到其他类中&#xff0c;提升开发效率。Autowired又是被大家最为熟知的方式&#xff0c;但很多开发者在使用 IntelliJ IDEA …

软件工程的概论

软件的概念与特点 软件的定义 软件 程序 数据 文档 软件的特征 1。软件是人开发的 2。软件生产是简单的拷贝 3。软件会多次生产 4。软件开发环境对产品影响很大 5。 软件的双重作用 一方面是一种产品另一方面是开发其他软件产品的工具。 软件分类 按软件功能&…

1. 握手问题python解法——2024年省赛蓝桥杯真题

原题传送门&#xff1a;1.握手问题 - 蓝桥云课 问题描述 小蓝组织了一场算法交流会议&#xff0c;总共有 50人参加了本次会议。在会议上&#xff0c;大家进行了握手交流。按照惯例他们每个人都要与除自己以外的其他所有人进行一次握手 (且仅有一次)。但有 7 个人&#xff0c;…

【Uniapp-Vue3】setTabBar设置TabBar和下拉刷新API

一、setTabBar设置 uni.setTabBarItem({ index:"需要修改第几个", text:"修改后的文字内容" }) 二、tabBar的隐藏和显式 // 隐藏tabBar uni.hideTabBar(); // 显示tabBar uni.showTabBar(); 三、为tabBar右上角添加文本 uni.setTabBarBadge({ index:"…

Visual Studio Code修改terminal字体

个人博客地址&#xff1a;Visual Studio Code修改terminal字体 | 一张假钞的真实世界 默认打开中断后字体显示如下&#xff1a; 打开设置&#xff0c;搜索配置项terminal.integrated.fontFamily&#xff0c;修改配置为monospace。修改后效果如下&#xff1a;

使用ArcMap或ArcGIS Pro连接达梦数据库创建空间数据库

一、ArcMap 1、本地windows安装 32 位 DM 数据库客户端 2、覆盖dll 将 32 位 DM 数据的..\dmdbms\bin 目录中的 .dll 文件全部拷贝到 ArcGIS 的 ..\Desktop10.5\bin 目录下&#xff0c;有同名文件直接覆盖掉 3、开启达梦数据库空间扩展支持 使用管理员用户登录数据&#xff…

案例研究丨浪潮云洲通过DataEase推进多维度数据可视化建设

浪潮云洲工业互联网有限公司&#xff08;以下简称为“浪潮云洲”&#xff09;成立于2018年&#xff0c;定位于工业数字基础设施建设商、具有国际影响力的工业互联网平台运营商、生产性互联网头部服务商。截至目前&#xff0c;浪潮云洲工业互联网平台连续五年入选跨行业跨领域工…

ASP.NET Core 6.0 如何处理丢失的 Startup.cs 文件

介绍 .NET 6.0 已经发布&#xff0c;ASP.NET Core 6.0 也已发布。其中有不少变化让很多人感到困惑。例如&#xff0c;“谁动了我的奶酪”&#xff0c;它在哪里Startup.cs&#xff1f;在这篇文章中&#xff0c;我将深入研究这个问题&#xff0c;看看它移动到了哪里以及其他变化。…

iOS 集成ffmpeg

前言 本来打算用flutter去实现一个ffmpeg的项目的&#xff0c;不过仔细分析了一下&#xff0c;我后期需要集成OpenGL ES做视频渲染处理&#xff0c;OpenGL ES的使用目前在flutter上面还不是很成熟&#xff0c;所以最后还是选择用原生来开发 ffmpeg集成到iOS工程 iOS对于ffmp…

基于微信小程序的移动学习平台的设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导&#xff0c;欢迎高校老师/同行前辈交流合作✌。 技术范围&#xff1a;SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容&#xff1a;…