网络原理-------TCP协议

news2024/11/17 13:00:18

文章目录

  • TCP协议
    • TCP协议段格式
    • TCP原理
      • 确认应答机制 (安全机制)
      • 超时重传机制 (安全机制)
      • 连接管理机制 (安全机制)
      • 滑动窗口 (效率机制)
      • 流量控制 (安全机制)
      • 拥塞控制 (安全机制)
      • 延迟应答 (效率机制)
      • 捎带应答 (效率机制)
    • 基于TCP的应用层协议

TCP协议

TCP, 即 Transmission Control Protocol, 传输控制协议. 是要对数据进行一个详细的控制.

TCP协议段格式

在这里插入图片描述

  • 源/目的端口号: 表示数据是从那个进程来, 到哪个进程去.
  • 32位序号: 它指示了TCP报文中第一个数据字节的序列号.
  • 32为确认号: 表示接收方期望从发送方接收到的下一个字节的序号.
  • 4位TCP报头长度: 表示TCP头部有多少个32bit (有多少个4字节); 所以TCP头部的最大长度为 15 * 4 = 60.
  • 6位标志位:
    • URG: 紧急指针是否有效
    • ACK: 确认号是否有效
    • PSH: 提示接收端应用程序立刻从缓冲区把数据读走
    • RST: 对方要求重新建立连接, 我们把携带RST标识的称为复位报文段
    • SYN: 请求建立连接, 我们把携带SYN标识的称为同步报文段
    • FIN: 通知对方, 本端要关闭了, 我们把携带FIN标识的称为结束报文段
  • 16位窗口大小: 用于数据流的流量控制, 可以表示接收方可以接受的未确认数据的字节数量; 避免网络拥塞.
  • 16位校验和: 发送端填充, CRC校验. 接收端校验不通过, 则认为数据有问题. 此处的校验和不光包含TCP首部, 也包含TCP数据部分.
  • 16位紧急指针: 标识哪部分数据是紧急数据.

TCP原理

TCP对数据提供的管控机制, 主要体现在两个方面: 安全和效率.

这些机制和多线程的设计原则类似: 保证数据安全的前提下, 尽可能的提升传输效率.

确认应答机制 (安全机制)

在这里插入图片描述

TCP将每个字节的数据都进行了编号, 即序列号.

在这里插入图片描述

每一个ACK都带有对应的确认序列号,意思是告诉发送者,我已经收到了哪些数据;下一次你从哪里开
始发.

超时重传机制 (安全机制)

在这里插入图片描述

主机A给主机B发送数据后, 可能因为网络拥堵等原因, 数据无法到达主机B

如果主机A在一个特定时间间隔内没有收到主机B发来的确认应答, 就会进行重传

但是主机A未收到主机B的确认应答也可能是因为ACK丢失了.

在这里插入图片描述

因此TCP会收到很多重复的数据, 那么TCP协议需要识别出哪些包是重复的包, 并把重复的包丢弃掉.

这时用我们前面的确认号, 就可以很轻易的做到.

那么, 超时的时间该如何规定呢?

最理想的情况下, 找到一个最小的时间, 保证 “确认应答” 一定能在这个时间内返回.

但是这个时间的长短, 根据网络环境的不同, 是有差异的.

如果设定的时间太长, 会影响整体的重传效率.

如果设定的时间太短, 有可能会频繁发送重复的包.

TCP为了保证在任何环境下, 都能保持叫高性能的通信, 因此会动态计算这个最大超时时间.

Linux中(BSD Unix和Windows也是如此),超时以500ms为一个单位进行控制, 每次超时重发的时间都是500ms的整数倍.

如果重发一次后, 仍然得不到应答, 等待2*500ms后在进行重传

如果仍得不到应答, 就等待4*500ms进行重传, 指数型递增.

累积到一定重传次数, TCP就会认为网络或对端主机出现异常, 强制关闭连接.

连接管理机制 (安全机制)

在正常情况下, TCP要经过三次握手建立连接, 四次挥手断开连接.

在这里插入图片描述

客户端与服务器状态转化:

  • 服务器[CLOSED -> LISTEN] 服务器调用listen后进入LISTEN状态, 等待客户端连接
  • 客户端[CLOSED -> SYN_SENT] 客户端调用connect, 发送同步报文段
  • 服务器[LISTEN -> SYN_RCVD] 一旦监听到连接请求 (同步报文段), 就将该连接放入内核等待队列中, 并向客户端发送SYN确认报文
  • 客户端[SYN_SENT -> ESTABLISHED] connect调用成功, 则进入ESTABUSHED状态, 开始读写数据
  • 服务器[SYN_RCVD -> ESTABLISHED] 服务器一旦接收到客户端的确认报文, 就进入ESTABLISHED状态, 可以进行读写数据了
  • 客户端[ESTABLISHED -> FIN_WAIT_1] 客户主动调用close时, 向服务器发送结束报文段, 同时进入FIN_WAIT_1
  • 服务器[ESTABLISHED -> CLOSE_WAIT] 当客户端主动关闭连接 (调用close), 服务器会收到结束报文段, 服务器返回确认报文段并进入CLOSET_WAIT
  • 客户端[FIN_WAIT_1 -> FIN_WAIT_2] 客户端收到服务器对结束报文段的确认, 则进入FIN_WAIT_2, 开始等待服务器的结束报文段
  • 服务器[CLOSE_WAIT -> LAST_ACK] 进入CLOSE_WAIT后说明服务器准备关闭连接 (需要处理完之前的数据), 当服务器真正调用close关闭连接时, 会向客户端发送FIN, 此时服务器进入LAST_ACK状态, 等待最后一个ACK到来
  • 客户端[FIN_WAIT_2 -> TIME_WAIT] 客户端收到服务器发来的FIN (结束报文段), 进入TIME_WAIT, 并发出LAST_ACK
  • 服务器[LAST_ACK -> CLOSED] 收到ACK彻底关闭连接
  • 客户端[TIME_WAIT -> COSED] 客户端要等待一个2MSL (Max Se’gment Life, 报文最大生成时间) 的时间, 才会进入CLOSE状态

为什么TIME_WAIT的时间是2MSL?

MSL是TCP报文最大生存时间, 因此TIME_WAIT持续存在2MSL的话, 就能保证在两个传输方向上的未被接受或迟到的报文段都已消失 (否则服务器立即重启, 可能会收到来自上一个进程的迟到的数据, 但是这种数据可能是错误的, 延时, 重传, 或者乱序); 同时也是在理论上保证最后一一个报文可靠到达 (假设最后一个ACK丢失, 那么服务器会重新再发一个FIN, 这时虽然客户端不在了, 但是TCP连接还在, 依然可以重发LAST_ACK)

滑动窗口 (效率机制)

确认应答策略是, 对每个发送的数据段, 都要给一个ACK确认应答, 收到ACK后再发送下一个数据段. 这样的话就有一个很大的缺点, 就是性能较差, 尤其是数据往返时间较长的时候.

在这里插入图片描述

既然这样一发一收的方式性能低, 那么我们一次发送多条数据, 就可以大大的提高性能 (其实是将多个段的等待时间重叠在一起).

在这里插入图片描述

  • 窗口大小指的是无需等待确认应答而可以继续发送数据的最大值, 上图的窗口大小就是4000个字节 (四个段).
  • 发送前四个字段的时候, 不需要等待任何ACK, 直接发送.
  • 收到第一个ACK, 滑动窗口向后移动, 继续发送第五个的数据, 以此类推.
  • 操作系统内核为了维护这个滑动窗口, 需要开辟 发送缓冲区 来记录当前还有哪些数据没有应答, 只有确认应答过的数据, 才能从缓冲区删掉
  • 窗口越大, 网络的吞吐率就越高

在这里插入图片描述

那么如果出现了丢包, 如何进行重传? 这里分两种情况讨论:

情况一: 数据包已经到达, ACK被丢了.

在这里插入图片描述

这种情况下, 部分ACK丢了并不要紧, 因为可以通过后续的ACK进行确认;

**情况二:**数据包直接丢了

  • 当某一段报文丢失后, 发送端会一直收到 “1001” 这样的ACK, 就是在提醒发送端;

  • 如果发送端主机连续三次收到了同一个 “1001” 这样的回答, 就会将对应的 1001-2000 的数据重新发送;

  • 这时候接收端接收到1001-2000的数据后, 返回的就是 “7001” 了, 因为 2001-7000 的数据接收端在之前就收到了, 被放到了接收端操作系统内核的接受缓冲区

这种机制被称为 “高速重发控制” (也叫 “快重传”)

流量控制 (安全机制)

接收端处理数据的速度是有限的, 如果发送方发送数据太快, 导致接收端的缓冲区被打满, 这个时候如果发送端继续发送数据, 就会造成丢包, 继而引起丢包重传等一系列连锁反应.

因此TCP支持根据接收端的处理能力, 来决定发送端的发送速度. 这个机制就叫流量控制 (Flow Control);

接收端将自己可以接受的缓冲区大小放入TCP首部中的 “窗口大小” 字段, 通过ACK通知发送端;

窗口大小字段越大, 说明网络的吞吐率越高;

接收端一旦发现自己的缓冲区要满了, 就会将窗口大小设置为更小的值通知发送端;

发送端接收到这个小窗口大小后就会减慢自己的发送速度;

如果接收端发送缓冲区满了, 就会将窗口大小设置为0; 这时发送端就不再发送数据, 但是需要定期发送一个窗口探测数据段, 是接收端把窗口大小告诉发送端.

在这里插入图片描述

接收端如何把窗口大小告诉发送端呢? 回忆一下我们的TCP首部中, 有一个16位窗口字段, 就是存放了窗口大小信息;

那么问题来了, 16位数字最大表示65535, 那么TCP窗口最大就是65535吗?

并非如此, TCP首部40字节选项中还包含了一个窗口扩大因子M, 实际窗口大小是窗口字段的值左移M位;

拥塞控制 (安全机制)

TCP引入慢启动机制, 先发少量的数据, 探探路, 摸清当前的网络拥堵状态, 再决定按照多大的速度传输数据;

在这里插入图片描述

此处引入一个概念为拥塞窗口;

发送开始的时候, 定义拥塞窗口大小为1;

每次收到一个ACK应答, 拥塞窗口加一;

每次发送数据包的时候, 将拥塞窗口和接收端主机反馈的窗口大小作比较, 取较小的值作为实际发送的窗口;

像上面这样的拥塞窗口增长速度, 是指数级别的. "慢启动"只是指初始时慢, 但是增长速度非常快.

为了不增长的那么快, 因此不能使拥塞窗口单纯的加倍;

为此引入一个慢启动的阈值;

当拥塞窗口超过这个阈值的时候, 不再按照指数方式增长, 而是按照线性方式增长

在这里插入图片描述

当TCP开始启动的时候, 慢启动阈值等于窗口最大值;

在每次超时重发的时候, 慢启动阈值会变成原来的一半, 同时拥塞窗口置回一;

少量的丢包, 我们仅仅是触发超时重传; 大量的丢包我们就认为网络拥塞;

当TCP通信开始后, 网络吞吐量会逐渐上升; 随着网络发生拥堵, 吞吐量就会立刻下降;

总结一下:

拥塞控制, 就是TCP协议想尽可能把数据传输给对方, 但是又要避免给网络造成太大压力的折中方案.

延迟应答 (效率机制)

如果接受数据的主机立即返回ACK应答, 这时返回的窗口可能比较小:

假设接受端缓冲区为1M, 一次收到了500k的数据; 如果立刻应答, 返回的窗口就是500k;

但实际上可能处理端的处理速度很快, 10ms之内就把500k的数据从缓冲区消掉了;

在这种情况下, 接受处理端还远没达到自己的极限, 即使窗口再放大一些, 也能处理过来;

如果接收端稍微等一会儿再应答, 比如等待200ms, 那么这个时候返回的窗口大小就是1M;

窗口越大, 网络吞吐率就越大, 传输效率就越高. 我们的目标是在保证网络不拥塞的情况下尽量提高传输效率;

我们的方案是:

数量限制: 每个N个包就应答一次;

时间限制: 超过最大延时时间就应答一次;

具体数量和超过时间, 依操作系统不同也有差异; 一般N取2, 最大延时时间取200ms;

在这里插入图片描述

捎带应答 (效率机制)

在延迟应答的基础上, 我们发现很多情况下, 客户端和服务器在应用层也是 “一发一收” 的. 那么当服务器给客户端回消息的时候, ACK就可以 “搭顺风车” 和服务器回应的一起返回给客户端.

在这里插入图片描述

基于TCP的应用层协议

  • HTTP
  • HTTPS
  • SSH
  • Telent
  • FTP
  • SMTP

当然, 也包括自己写TCP程序时自定义的应用层协议;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1706835.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

鸿蒙OS开发:【一次开发,多端部署】(导航栏) 导航栏

一多导航栏 介绍 本示例展示了导航组件在不同设备形态下的样式。 在sm设备上,以tabs形式展示,内容、导航为上下样式布局,通过点击底部tabs切换内容;在md/lg设备上,以[SideBarContainer]形式展示,内容、导…

OZON平台支持什么ERP,芒果店长ERP

随着跨境电商行业的飞速发展,越来越多的电商平台与ERP系统展开了紧密的合作,旨在通过技术整合提升商家的运营效率和市场竞争力。在众多电商平台中,OZON以其独特的商业模式和强大的市场影响力,吸引了众多商家的目光。而芒果店长ERP…

Linux基础知识,配置网卡(七)

一、简介 1. 虚拟机的网络设置 目的1:让物理机和虚拟机之间可以互相通信 目的2:让虚拟机可以上网 目的3:让虚拟机之间可以互相通信 2.网络的类别 类别1:实现物理机和虚拟机之间通信 物理机只要安装了vmware之后,就会…

“SSH服务器拒绝了密码,请再试一次”的问题解决思路

大家在使用XShell工具连接Ubuntu系统时,可能会出现错误如下: 通过在网上查阅资料和实践解决这个问题,将我的思路分享给大家! 首先,我会先从使用Xshell连接远程服务器会涉及哪些东西上思考这个问题,即通过ssh服务连接远…

2024年5月软考成绩什么时候出?附查询方式

2024年5月软考成绩查询时间及查询方式: 查询时间:预计在2024年7月上旬进行。 查询方式: 方式一:登陆中国计算机技术职业资格网(www.ruankao.org.cn),点击报名系统,输入注册账号和…

ResNet论文解读—Residual Learning Deep for lmage Recognition(2016)

ResNet论文解读—Residual Learning Deep for lmage Recognition(2016) 研究背景 图像识别中的深度残差学习网络(MSRA:微软亚洲研究院) 认识数据集:ImageNet的大规模图像识别挑战赛 LSVRC-2015:ImageNet Large Scale Visual Rec…

Android 中资源文件夹RES/RAW和ASSETS的使用区别

文章目录 1、res/raw 文件夹1.1、特点1.2、使用方法1.3、示例: 2. assets 文件夹2.1、特点2.2、使用方法2.3、示例: 3、使用场景3.1、res/raw 使用场景3.2、assets 使用场景 4、比较与选择5、文件夹选择的建议6、 示例代码总结6.1、res/raw 示例6.2、ass…

Raven2掠夺者2渡鸦2账号需要验证怎么解决 超简单验证账号教程

《渡鸦2》是一款源自韩国的创新力作,作为《Raven》系列的最新续篇,这款游戏在MMORPG手游领域内再度扩展了其标志性的暗黑奇幻宇宙,融入了大量革新的游戏设计与丰富内容。定档于2024年5月29日开启公测的《渡鸦2》,正处在紧张刺激的…

2024年物理化学与工程技术发展国际会议(ICPCETD 2024)

全称:2024年物理化学与工程技术发展国际会议(ICPCETD 2024) 会议网址:http://www.icpcetd.com 会议时间: 2024.06.30 截稿时间:2024.06.21 会议地点: 上海 投稿邮箱:icpcetd_info163.com 投稿标题:ArticleT…

【UE C++】 虚幻引擎C++开发需要掌握的C++和U++的基础知识有哪些?

目录 0 引言1 关键的 C 知识2 Unreal Engine 相关知识3 学习建议 🙋‍♂️ 作者:海码007📜 专栏:UE虚幻引擎专栏💥 标题:【UE C】 虚幻引擎C开发需要掌握的C和U的基础知识有哪些?❣️ 寄语&…

代码随想录算法训练营第五十三天||1143.最长公共子序列、1035.不相交的线、53. 最大子序和

文章目录 一、1143.最长公共子序列 思路 二、1035.不相交的线 思路 三.53. 最大子序和 思路 一、1143.最长公共子序列 给定两个字符串 text1 和 text2,返回这两个字符串的最长公共子序列的长度。 一个字符串的 子序列 是指这样一个新的字符串:它是由原…

VPN的详细理解

VPN(Virtual Private Network,虚拟私人网络)是一种在公共网络上建立加密通道的技术,通过这种技术可以使远程用户访问公司内部网络资源时,实现安全的连接和数据传输。以下是对VPN的详细介绍: 选择代理浏览器…

node_相关知识点

Node.js采用谷歌的V8引擎,是一个服务器端的、非阻断式I/O的、事件驱动的JavaScript运行环境,可优化应用程序的传输量和规模。传统服务器多线程(一个请求一个线程)易阻塞。 一、线程、进程: 进程:进程负责…

今天想看点干货?Constraintlayout等你好久啦!

大家好,我是小布丁。 从今天开始要开一个新坑啦,我会系统地把我学到的Android基础知识分享出来,我也想过这样是否有必要,毕竟分享的都是一些很基础的内容,但是很多人也和我一样正处于Android小白阶段,我能…

RedHat9 | DNS剖析-配置转发DNS服务器

一、实验环境 1、转发DNS服务器 转发服务器(Forwarding Server)接受查询请求,但不直接提供DNS解析,而是将所有查询请求发送到另外一台DNS服务器,查询到结果后保存在本地缓存中。如果没有指定转发服务器,D…

PyCharm基本配置内容

如何更换 Python 解释器 输入一段代码点击运行后,画面下方有一个路径如图中框中所示: 上面的路径为虚拟路径,可以改为我们自己设置的路径 点击设置,选择settings 选择Project:y002———》Python Interpreter&#…

MySQL 重启之后无法写入数据了?

数据库交接后因 persist_only 级别的参数设置引发的故障分析。 作者:不吃芫荽,爱可生华东交付服务部 DBA 成员,主要负责 MySQL 故障处理及相关技术支持。 爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系…

解密Prompt系列15. LLM Agent之数据库应用设计:DIN C3 SQL-Palm BIRD

上一章我们主要讲搜索引擎和LLM的应用设计,这一章我们来唠唠大模型和DB数据库之间的交互方案。有很多数据平台已经接入,可以先去玩玩再来看下面的实现方案,推荐 [sql translate]:简单,文本到SQL,SQL到文本…

【PID算法详解】

PID算法 PID算法介绍用途pid数学表达式及其含义P算法D算法I算法 PID总结数学公式转换代码设计实际运用PID代码实现 PID算法介绍 PID控制器是一种广泛应用于工业控制系统的反馈控制器,它通过比例(Proportional)、积分(Integral&am…

LeetCode199二叉树的右视图

题目描述 给定一个二叉树的 根节点 root,想象自己站在它的右侧,按照从顶部到底部的顺序,返回从右侧所能看到的节点值。 解析 这一题的关键其实就是找到怎么去得到当前是哪一层级,可以利用队列对二叉树进行层次遍历,但…