Linux学习之Tcp与Udp

news2024/11/24 4:45:12

目录

UDP

Udp协议的格式

UDP的传输特性

UDP的缓冲区

  基于UDP的应用层协议

 TCP协议

TCP的报文格式

1.ACK确认应答机制

2.超时重传

3.TCP的链接管理机制

为什么要三次握手呢?

理解TIME_WAIT状态

 流量控制(可靠性+效率)

滑动窗口

拥塞控制

TCP的特点


UDP

我们系看看udp协议:

Udp协议的格式

 UDP报文一共16字节,由UDP首部和UDP数据组成,在进行校验时,如果校验出错,就会选择丢弃。

首部格式:8字节
源端口:2字节
目的端口:2字节
长度:2字节,含UDP首部和载荷
校验:2字节

UDP的传输特性

 UDP的传输过程类似于寄信。

UDP在传输信息时,如果检验出错,就会丢弃报文,并不会通知对方,因此传输特性为:

无连接性:传输数据时,是不会向对方请求建立连接的,直到ip地址和端口号就进行传输。

不可靠:因为无连接,那么数据在传输过程中,是无法保证能准确到达目的地,没有确认机制,也没有重传机制,如果校验有错,报文直接就没了,也不知到原因,也收不到。

面向数据报:不能够灵活的控制读写数据的次数和数量。每次发送数据都可以认为是再发邮件,且要一次就把邮件的内容全读取到。

 在我们之前学习Tcp套接字的时候,我们知道Tcp在数据传输过程中,是要去定制协议的,每一次都需要对发送或者读取的数据进行定长,定格式,一次就发一串报文接受也一样,需要对数据序列化与反序列化。而对于UDP这都是不需要做的,发多少,就收多少。

UDP的缓冲区

在编写UDP套接字的时候,我们基本就了解到在发送消息和接收消息的时候,我们貌似只用了一个缓冲区,既可以读,也可以写,我们称为全双工。

实际上UDP并没有真正意义上的发送缓冲区,在调用sendto时会直接交给给内核,由内核将数据传给网络协议进行后续的传输。

但UDP具有接收缓冲区,但是并不保证接受报和发送报的数据顺序是否一致,且缓冲区满了数据就会被丢弃。

注意事项:

 UDP 协议首部中有一个 16 位的最大长度 . 也就是说一个 UDP 能传输的数据最大长度是 64K( 包含 UDP 首 部). 然而64K 在当今的互联网环境下 , 是一个非常小的数字 . 如果我们需要传输的数据超过64K, 就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装 ;

  基于UDP的应用层协议

NFS: 网络文件系统
TFTP: 简单文件传输协议
DHCP: 动态主机配置协议
BOOTP: 启动协议 ( 用于无盘设备启动 )
DNS: 域名解析协议

 TCP协议

相对于UDP协议,TCP协议就更加的重要了,TCP---传输控制协议面积对数据传输会做详细的控制,对于数据什么时候发,发多少,发错了怎么办全由TCP自主决定。

宏观上就是将数据拷贝到的缓冲区,之后交给协议传输,发送方再从缓冲区处拷贝数据,即本质就是数据拷贝。

TCP的报文格式

不同层时,对数据的的描述方式也不一样,对于传输层骂我们一般叫做数据段。

TCP传输面向字节流
报文首部:固定20字节,最长60字节
源端口:2字节
目的端口:2字节
SN:序号,4字节,报文段所发送的第一个字节的序号
ACK:确认号,4字节,期望收到对方下一个报文段的第一个字节的序号
Data Offset:数据偏移,4位,即首部长度,无选项时为0x5
控制位:12位,后五位依次为:ACK,PSH,RST,SYN,FIN
第一次握手:0x02(SYN)
第二次握手:0x12(SYN+ACK)
第三次握手:0x10(ACK)
第一次挥手:0x19(ACK+PSH+FIN)
第二次挥手:0x10(ACK)
第三次挥手:0x19(ACK+PSH+FIN)
第四次挥手:0x10(ACK)
窗口:2字节,发送方的接收窗口大小
校验:2字节
紧急指针:2字节
选项:MSS选项(4字节)
前两次握手时一般需要协商MSS,因此数据偏移和控制位分别为0x6002和0x6012-第三次握手和所有四次挥手一般无选项
三次握手
第一次:ACK1=0(无ACK标志)
第二次:ACK2=SN1+1
第三次:SN3=ACK2=SN1+1,ACK3=SN2+1
四次挥手
第二次:SN2=ACK1,ACK2=SN1+1
第三次:SN3=SN2,ACK3=ACK2
第四次:SN4=ACK3=SN1+1,ACK4=SN3+1

TCP的前20字节为它的标准报头,之后的为数据的有效载荷。 

那么如何对数据的报头和有效载荷进行分离呢:固定长度+自描述字段

第一层是16源端口号与16位目的端口号(32位序号)(32位的确认序号)

序列号与确认字段号都是为了保证数据可靠传输:

 此外还有确认序号,表示确认字段号前的数据我已经接收到了。

至于为什么要有两个序号这是因为:极有可能是确认应答的报文,也有可能时数据加确认报文。

第二层首先是单位大小位4字节的首部长度,之后16位的窗口大小

 先以前两层来看,如果发送发一直向接收方发送数据,因为发送方并不知道接收方的承受能力,所以当缓冲区的数据溢满了,此时就有可能来不及接收数据,(发送方还在发),就会出现数据大面积丢失的情况。为了确保数据发送是安全可靠的,因此需要根据接收方的缓冲区,控制发送数据的速率,这种方式就叫做流量控制。

其次每次发送还需要有确认应答机制保证数据传输。除此之外,如果还存在数据发送后丢包,还会有超时重发机制。综上我们再来看看报文的接收与发送。

所以发送方发送后每一要回收应答,从而确定自己的传输速率(根据接收方接收缓冲区的大小),而这里16位字段存储的就是接收方剩余空间的大小。

6 位标志位 :
URG: 紧急指针是否有效
ACK: 确认号是否有效
PSH: 提示接收端应用程序立刻从 TCP 缓冲区把数据读走
RST: 对方要求重新建立连接 ; 我们把携带 RST 标识的称为 复位报文段(存在二次握手最后发数据,及连接建立不一致(网络问题))
SYN: 请求建立连接 ; 我们把携带 SYN 标识的称为 同步报文段
FIN: 通知对方 , 本端要关闭了

 连接建立是否成功就看能不能收到第三次发送的确报文;链接一旦连接建立好,由于有多个客户端,所以我们还需要对链接进行管理。

综上基本上TCP的包头的字段的主要功能就是这些了。

现在我们再来细看关于TCP的一些确保数据安全传输的机制:

1.ACK确认应答机制

ACK应答机制我们在6个标志位字段已经了解过了,如发送方通过三次握手建立连接中,就是通过设置报文中的ACK字段,表明已确认收到报文,以及在数据的发送过程中。

2.超时重传

 实际上数据在传输的过程,我们并不会知道关心数据是不是丢包了,还是在阻塞者,我们只有当接收方收到才知道传输没问题,但我们怎么去确信数据是丢包了还是阻塞?因此通过设定固定的时间间隔,如果超时(可能阻塞----路由选择的路径太差,可能网络断开丢包了),都会重新传输该报文。

3.TCP的链接管理机制

 刚开始,发送方想要和接收方发送数据前,需要先建立连接,通过三次握手:

发送方先向接收方发送建立连接的请求SYN,接收方接受后发送确认建立连接ACK+SYN,之后发送发收到,发送确认收到建立连接的报文ACK。

之后就进行数据传输。

所以在我们编写套接字的时候,接口connect就是去形成一个建立连接请求的报文,而accept只关心三次握手成功时,返回的文件缓冲区connfd。

最后关闭连接的时候,通过四次挥手关闭连接:想要关闭的一方向接收方发送FIN报文,请求断开连接,接收方接收到后发送确认收到ACK,之后在向对方发送取消l连接的报文FIN,之后发送方再次发送ACK确认收到保文,并将自己的状态为立马ime_wait。套接字就是通过closed发送FIN报文。

链接有全连接对列,也有半连接对列--被建立连接的一方(维护的时间不长)。listen接口的第二个参数代表全链接队列的长度+1。

为什么全连接队列不能长呢--当上层很忙的时候,下层还不断有新的连接,那么没时间去处理对列,那么就会白白占用资源。

为什么要三次握手呢?

实际上真的是三次握手吗?发送方先发送SYN建立连接,接收方接受到后向对方发送ACK,之后再次向发送方发送建立链接的请求,只不过在发送时,我们将这两条报文合二为一了,即ACK+SYN

(应答时附带建立SYN报文),之后收到再次发送ACK,确认建立。

看到这里我们发现,其实四次挥手也可以压缩为三次挥手。

至于为什么不压缩,对于连接时,SYN与ACK不存在时间差,你给我发,我就跟你建立连接。但是在挥手时,你给我说再见,我不会直接就跟你说再见,我指挥先收到你的再见,根据情况,在看是否真的就和你说再见。

1.建立三次握手有一点就是 验证全双工通道是否流畅。

2.如果只有一次握手,存在SYN泛洪攻击,一直发建立连接,服务端需要资源来接受,就存在连接资源被打满的情况,如果是两次握手,发送方先发送给服务端,服务端先建立连接后发送报文给客户端,此时客户端才建立连接,这还是会存在客户端出现异常导致服务端在建立连接消耗资源。

只要出现影响,后果全让服务端来承受,因为客户端的基数大。

但当三次握手时,我们能知道给你发送的确认,你是否收到,报文是否丢失。

理解TIME_WAIT状态

现在做一个测试 , 首先启动 server, 然后启动 client, 然后用 Ctrl-C 使 server 终止 , 这时马上再运行 server, 结果是 :
这是因为,虽然server的应用程序终止了,但TCP协议层的连接并没有完全断开,因此不能再次监 听同样的server端口.
我们用netstat命令查看一下:
TCP协议规定,主动关闭连接的一方要处于TIME_ WAIT状态,等待两个MSL(maximum segment lifetime) 的时间后才能回到CLOSED状态.
我们使用Ctrl-C终止了server, 所以server是主动关闭连接的一方, 在TIME_WAIT期间仍然不能再次监听。
同样的server端口;
MSL在RFC1122中规定为两分钟,但是各操作系统的实现不同, 在Centos7上默认配置的值是60s;
可以通过 cat /proc/sys/net/ipv4/tcp_fin_timeout 查看msl的值;
那如何解决这个问题呢?
使用setsockopt()设置socket描述符的 选项SO_REUSEADDR为1, 表示允许创建端口号相同但IP地址不同的多个 socket描述符。

 那么为什么断开的时候,断开的一方需要等待呢?

1.让通信双方的历史数据消散。

2.让我们断开连接,四次挥手有较好的容错性。

 流量控制(可靠性+效率)

接收端处理数据的速度是有限的. 如果发送端发的太快, 导致接收端的缓冲区被打满, 这个时候如果发送端继续发送,就会造成丢包, 继而引起丢包重传等等一系列连锁反应. 
因此TCP支持根据接收端的处理能力, 来决定发送端的发送速度. 这个机制就叫做流量控制(Flow Control);
接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 "窗口大小" 字段, 通过ACK端通知发送端;
窗口大小字段越大, 说明网络的吞吐量越高;
接收端一旦发现自己的缓冲区快满了, 就会将窗口大小设置成一个更小的值通知给发送端;
发送端接受到这个窗口之后, 就会减慢自己的发送速度;
如果接收端缓冲区满了, 就会将窗口置为0; 这时发送方不再发送数据, 但是需要定期发送一个窗口探测数据段, 使接收端把窗口大小告诉发送端

在超时重传的时候,首先会想接收方发送一个窗口检测,判断双方是否能通信,如果你发不了,我收不到,那大概率就是网络的问题了,此时就断开链接了。

滑动窗口

我们已经了解到了确认应答机制是为了保证数据的可靠性,发送一次数据包,收到后就要向我发送ACK,没发一次,对应就要发ACK,如果距离太远,那么数据传输的效率就比较低了。

因此在实际发送数据时,发送方会将发送的数据进行分批次发出去,接收方接受这些请求再一个个发送确认报文,由于某些问题,接收方接受了,但没发送确认,根据超时传输再次发送,此时还没发送确认的数据就还是会保存到缓冲区当中,所以需要对缓冲区进行分区,这里我们简单的分区:

对于发送缓冲区:

发送滑动窗口的大小一般为接收方的窗口的大小。一般使用双指针对区域进行划分,如果区域需要扩大或者缩小,指针就可以向前或者向后滑动--因此被称为滑动窗口。

在该窗口内的报文,可以立即发送,可以不需要收到应答。

但是如果存在滑动窗口中间丢包怎么办?如果不是头一个ACK丢失,即使丢包了,滑动窗口也能确认丢包之后的ACK,因为存在确认序号。即使丢了,也能向后继续更新。

所以每次都是尽快的将数据从内核拿出来, 腾出更大的缓冲区,这样窗口也就大了。

拥塞控制

虽然 TCP 有了滑动窗口这个大杀器 , 能够高效可靠的发送大量的数据 . 但是如果在刚开始阶段就发送大量的数据 , 仍 然可能引发问题:
因为网络上有很多的计算机 , 可能当前的网络状态就已经比较拥堵 . 在不清楚当前网络状态下 , 贸然发送大量的数据 , 是很有可能引起雪上加霜的. TCP引入
慢启动 机制 , 先发少量的数据 , 探探路 , 摸清当前的网络拥堵状态 , 再决定按照多大的速度传输数据 ;

TCP的特点

与UDP相比,TCP具有发送缓冲区,在将数据拷贝至发送缓冲区时,会有tcp下层协议决定,之后接收方从接收缓冲古拷贝数据。总结就是TCP是一个由接受和发送缓冲区的,全双工的,数据发送控制的一个协议。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1634252.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++栈和队列模拟

栈和队列所用的容器默认都为deque,这种容器可以看作是一种vector和list的中间性能容器。 而deque虽然头插、尾插效率很好,且支持 [ ] 访问(默认容器为它的原因),但是 他的缺点也很明显: 1.中间插入删除会…

【C++算法竞赛 · 图论】树

目录 前言 树 树的定义 树的相关概念 树的遍历 1 先序遍历 2 中序遍历 3 后序遍历 前言 前两篇文章(【C算法竞赛 图论】图论基础、【C算法竞赛 图论】图的存储)中,介绍了图的相关概念与存储,还不了解的可以去补补课。 …

【百度Apollo】探索自动驾驶:小白教学如何使用 Dreamview 播放数据包

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《linux深造日志》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 引入一、Dreamview 简介二、使用 Dreamview 具体步骤步骤一:进入 Apollo Docker 环境步骤二&#xff…

数学建模--图论最短路径基础

1.图的定义 学过数据结构或者离散数学的小伙伴们应该知道图的概念,我在这里简单的介绍一下: 图的概念和我们理解的是很不一样的,这里的图并不是我们的生活里面的图片,而是一种表示不同的数据之间的关系,例如这里的5个…

hive使用hplsql进行etl或其它数据加工

参照 https://cwiki.apache.org/confluence/pages/viewpage.action?pageId59690156 http://www.hplsql.org/doc Hive HPL/SQL,即Hive Hybrid Procedural SQL一个开源工具,它为hive实现了过程性的SQL功能,类似Oracle的PLSQL。从hive 2.0.0开…

电机控制系列模块解析(12)—— 过调制

一、过调制 电机控制中的过调制(Overmodulation)是指在实施脉宽调制(PWM)过程中,使调制指数(调制深度)超过常规线性调制区的极限,进入非线性调制区域。这一策略通常应用于诸如空间矢…

NIO(非阻塞I/O)和IO(阻塞I/O)详解

文章目录 一、NIO(Non-blocking I/O,非阻塞I/O)1、Channel(通道)与Buffer(缓冲区)1.1、使用ByteBuffer读取文件1.2、ByteBuffer 方法1.2、ByteBuffer 结构1.3、字符串与 ByteBuffer 互转1.4 Sca…

Android 音视频播放器 Demo(一)—— 视频解码与渲染

本篇作为 Android 音视频实战系列的第二篇文章,主要介绍视频解码与渲染过程。本系列文章目录如下: Android 音视频基础知识 Android 音视频播放器 Demo(一)—— 视频解码与渲染 Android 音视频播放器 Demo(二&#xff…

数据结构-链表练习(面试题)

1,翻转一个单链表 建立变量cur指向第二个节点,curN指向cur.next,将第二个节点的next改为head,headcur这样实现,前两个节点顺序的翻转,第二个节点指向了第一个节点,之后cur向后移(cu…

linux中 虚拟机 修改时间 centos7

方法1 :虚拟机内 设置 方法2 代码实现 timedatectl set-timezone "Asia/Shanghai"

Detla lake with Java--在spark集群上运行程序

昨天写了第一篇入门,今天看见有人收藏,继续努力学习下去。今天要实现的内容是如何将昨天的HelloDetlaLake 在spark集群上运行,。具体步骤如下 1、安装spark,我使用的是 spark-3.5.1-bin-hadoop3-scala2.13,去官网下载&#xff0c…

Secure CRT 文件传输

Secure CRT 文件传输 Secure CRT支持多种文件传输协议,其中最常用的是Xmodem、Ymodem、Zmodem和Kermit。这些协议允许在本地计算机和远程主机之间安全地传输文件。 Xmodem: Xmodem是一种简单的协议,通常用于在串行连接上进行文件传输。它通过…

【程序错误-显存不足】RuntimeError: CUDA out of memory. Tried to allocate 4.00 GiB

目录 1. 问题2. 解决方法2.1 租服务器(试过有用)2.2 减小batchsize2.3 减少模型大小2.3 检查模型本身没有发现错误,最终确认是验证集评估阶段的张量计算非常占用空间。2.3.1 可以对利用torch.tensor().detach().cpu().numpy()转为numpy,在cpu上进行loss和…

学习Rust的第22天:mini_grep第2部分

书接上文,在本文中,我们学习了如何通过将 Rust 程序的逻辑移至单独的库箱中并采用测试驱动开发 (TDD) 实践来重构 Rust 程序。通过在实现功能之前编写测试,我们确保了代码的可靠性。我们涵盖了基本的 Rust 概念,例如错误处理、环境…

【ARM Cache 系列文章 11.2 -- ARM Cache 组相联映射】

请阅读【ARM Cache 系列文章专栏导读】 文章目录 Cache 组相联映射组相联映射原理多路组相连缓存的优势多路组相连缓存的代价关联度(Associativity) 上篇文章:【ARM Cache 系列文章 11.1 – ARM Cache 全相连 详细介绍】 Cache 组相联映射 A…

文章解读与仿真程序复现思路——电力自动化设备EI\CSCD\北大核心《计及多重不确定性的虚拟电厂响应区间评估方法》

本专栏栏目提供文章与程序复现思路,具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

mysql-sql-练习题-4-标记

标记 连续登录2-7天用户建表排名找规律 最大连胜次数建表只输出连胜结果输出所有连续结果 连续登录2-7天用户 建表 create table continuous_login(user_id1 integer comment 用户id,date_login date comment 登陆日期 ) comment 用户登录表;insert into continuous_login val…

【Java基础】Spring核心之控制反转(IOC)

1. 如何理解IOC 1.1 什么是IOC 在Spring框架中,IOC(Inversion of Control,控制反转)是一种设计原则,它是Spring框架的核心概念之一。IOC的基本思想是将程序的控制权从应用程序代码中转移到框架或容器中,从…

c#数据库: 4.修改学生成绩

将4年级的学生成绩全部修改为100分,。修改前的学生信息表如图所示: using System; using System.Collections.Generic; using System.Data.SqlClient; using System.Linq; using System.Text; using System.Threading.Tasks;namespace StudentUpdate {internal class Program{s…

C++:运算符重载-加号(+)

在C中,运算符重载允许重新定义已有运算符的行为,以便让它们适用于自定义类型。这样,你可以通过自定义类型使用内置运算符,使得代码更加直观和易读。 此时我在代码中定义一个新类MyString: class MyString { public:i…