Socket编程权威指南(二)完美掌握TCP流式协议及Socket编程的recv()和send()

news2025/1/21 18:00:38

在上一篇文章中,我们学习了Socket编程的基础知识,包括创建Socket、绑定地址、监听连接、接收连接等操作。然而,真正的套接字编程远不止于此。本文将重点介绍TCP 流式协议,什么是粘包问题?如何解决粘包问题 ?以及recv()和send()这两个函数详细介绍,它们分别用于读取和发送数据,是网络编程中最为关键的环节。我们将详细剖析函数原型、参数含义,并通过实例代码展示具体用法,助你彻底掌握数据传输的精髓。


想详细了解socket 编程基础知识的同学,请前往查阅Socket编程权威指南(一)打通网络通信的任督二脉。


我们先来回顾一下 socket 编程的基本流程:

在这里插入图片描述


接下来,开始我们今天的正题。

一、TCP 流式协议


1、TCP 流式协议介绍

TCP(传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议。

以下是 TCP 作为流式协议的一些关键特性和详细说明:

  • 面向连接

    • TCP 需要在数据传输开始前建立一个连接。通过三次握手过程,客户端和服务器交换初始序列号,建立稳定的连接。
  • 字节流

    • 与数据报(如 UDP)不同,TCP 将数据视为字节流,而不是独立的数据包。这意味着 TCP 不保留数据包边界,应用程序需要自己处理数据的边界。
  • 可靠性

    • TCP 保证数据的可靠传输。它使用序列号和确认应答机制来确保数据按顺序、完整地到达目的地。
  • 有序性

    • TCP 保证数据包的有序传输。如果数据包丢失或乱序,TCP 会重传丢失的数据包并重新排序。
  • 拥塞控制

    • TCP 内置拥塞控制机制,通过调整数据的发送速率来避免网络拥塞。这是通过算法如慢启动、拥塞避免、快重传和快恢复实现的。
  • 流量控制

    • TCP 使用滑动窗口机制进行流量控制,接收方根据自己的接收能力告知发送方可以发送多少数据。
  • 全双工通信

    • TCP 允许双向通信,即客户端和服务器可以独立地发送和接收数据。
  • 数据传输

    • TCP 通过套接字接口提供数据传输服务。应用程序可以使用 read()write() 或专门的套接字系统调用如 recv()send() 进行数据传输。
  • 连接管理

    • TCP 连接的建立和终止通过三次握手和四次挥手过程管理。这些过程确保了连接的稳定建立和优雅关闭。
  • 超时和重传

    • 如果发送的数据没有得到及时确认,TCP 会自动重传数据,并且随着时间的推移,重传间隔会指数增长。
  • 保活和死锁检测

    • TCP 提供保活(keepalive)机制,以检测死连接。如果连接长时间没有活动,TCP 可以自动关闭连接。
  • 适用场景

    • TCP 适用于需要可靠传输的应用,如 Web 浏览(HTTP)、文件传输(FTP)、邮件传输(SMTP)和远程登录(SSH)。
  • 限制

    • 由于 TCP 是面向连接的协议,它在某些场景下可能不如 UDP 高效,特别是在实时通信或广播通信中。
  • 编程模型

    • TCP 编程通常涉及创建套接字、绑定、监听、连接、数据传输和关闭连接等步骤。

TCP 作为流式协议,其设计目标是提供可靠的数据传输服务。它通过多种机制确保数据的正确、有序传输,并通过拥塞控制和流量控制适应不同的网络条件。


也就是说,内核实现的
TCP 协议将保证将一个
TCP 包发送给另一端。

在这里插入图片描述

如上图:

拥塞控制是确保可靠数据传输协议有效运作的关键组成部分,因此,在TCP中,发送缓冲区和接收缓冲区成为了必不可少的元素。

在标准的Linux操作系统中,TCP的发送缓冲区和接收缓冲区默认的大小通常被设置为208KB。这意味着,如果进程A没有及时从其接收缓冲区中提取数据,那么传入的数据将继续在缓冲区内积累,直至达到其容量上限。


2、TCP 流式协议引发“粘包问题”

在网络上传输的数据本质上是二进制格式的,这意味着接收缓冲区里存放的内容同样是以二进制数据的形式存在。

数据根据其到达的顺序被依次放入接收缓冲区,这就可能导致所谓的“粘包”现象。

“粘包”这个词更像是一个方便描述的概念,实际上它并非一个正式的术语。

这个说法类似于描述从水龙头流出的水“粘”在一起,这当然不是字面上的粘连,而是用来形象地表达数据包在缓冲区中连续存放的情况。

简而言之,流式协议引发的一个问题是,我们如何识别接收缓冲区中的数据分别属于哪个TCP数据包?


在这里插入图片描述

以一个具体示例来说明,如果客户端向服务器发送了三个TCP数据包,分别包含内容QA、QB、QC,每个内容代表一个不同的请求。那么在服务器端的接收缓冲区(RecvBuffer)中,这些数据可能会连续排列成一串数据QAQBQC。服务器需要将这串连续的数据正确地拆分成三个独立的数据包,并对每个数据包进行相应的处理。


3、如何解决“粘包”问题?

通常,为了解决如何从接收缓冲区中区分不同TCP数据包的问题,我们会采用 包头+包体 的方式 。


在这里插入图片描述


正如上图所演示:在每个数据包前添加一个固定长度的包头,并在包头中记录数据包的总长度。包体部分则承载实际要传输的数据。

处理接收缓冲区数据的步骤如下:

  • Step 1: 首先从接收缓冲区读取固定大小的包头(例如20字节)。

  • Step 2: 解析包头,从中获取数据包的总长度,这里假设包头中包含的数据长度字段名为Header.Length

  • Step 3 : 根据Header.Length的值,确定接下来需要从接收缓冲区读取的数据量。

    例如,如果包头之后的数据总长度为1048字节,减去已读取的20字节包头,还需读取1028字节的数据。


通过这种方式,即使数据在接收缓冲区中是连续存放的,服务器也能够根据每个数据包的包头信息,正确地拆分和识别出独立的数据包。


二、recv()函数详解


recv() 函数是专用于
scoket 上的
read 操作,用于接收 TCP 套接字数据的系统调用。它在服务器端或客户端程序中用来从连接的对端读取数据,本质上是从接收缓冲区读取数据 ,该系统调用将返回实际读取的字节数,其值可能会小于传入的
length 参数。


以下是 recv() 函数的详细说明:

(1)、函数原型

ssize_t recv(int sockfd, void *buf, size_t len, int flags);

(2)、参数

  • sockfd:套接字描述符,表示要从中读取数据的 TCP 套接字。

  • buf:指向一个缓冲区的指针,用于存储接收到的数据。

  • len:缓冲区的大小,即 buf 可以存储的最大字节数。

  • flags:用来修改recv()行为的选项。常用的值包括:

    • 0:正常接收数据。

    • MSG_PEEK:窥视接收的数据,不从接收缓冲区中移除数据。

    • MSG_WAITALL:等待直到接收到 len 个字节的数据,或者出现错误。


(3)、返回值

  • 成功时,返回接收到的字节数,该值通常小于或等于 len

  • 失败时,返回 -1,并设置全局变量 errno 以指示错误类型。


(4)、错误处理

  • EAGAINEWOULDBLOCK:在非阻塞模式下,如果操作会阻塞,则返回此错误。
  • ECONNRESET:远程主机强行关闭了一个现有的连接。
  • ENOTCONN:套接字未连接,即未调用 connect()accept()
  • ENOTSOCKsockfd 不是一个套接字。

(5)、使用场景

  • 主要用于 TCP 套接字上的数据接收。对于 UDP 套接字,通常使用 recvfrom() 函数。

(6)、阻塞和非阻塞行为

  • 默认情况下,recv() 是阻塞的,它会等待直到至少接收到一个字节的数据。
  • 对于非阻塞套接字,如果接收缓冲区中没有数据,recv() 会立即返回,返回值为 0。

(7)、与 read() 的区别

  • read() 是一个通用的系统调用,用于读取文件描述符,而 recv() 专门用于套接字。

  • recv() 可以处理套接字选项和状态,而 read() 不能。


(8)、示例代码

接下来我们通过一个简单的客户端示例,演示如何使用recv()接收数据:

#include <iostream>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <cstring>

int main() {
    int sockfd = socket(AF_INET, SOCK_STREAM, 0);
    
    struct sockaddr_in servaddr;
    memset(&servaddr, 0, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_addr.s_addr = inet_addr("127.0.0.1");
    servaddr.sin_port = htons(8000);
    
    connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr));
    
    char buffer[1024];
    ssize_t nbytes = recv(sockfd, buffer, sizeof(buffer), 0);
    buffer[nbytes] = '\0';
    std::cout << "Received: " << buffer << std::endl;
    
    close(sockfd);
    return 0;
}

在这个例子中,客户端连接到本机的8000端口,然后使用recv()接收数据并输出到控制台。你可以自行运行并在服务器端发送数据,以验证recv()的效果。


(9)、注意事项:

  • 接收到的数据可能小于请求的长度,因此应用程序应该总是检查返回值。
  • recv() 可以与 select()poll() 结合使用,以实现更复杂的非阻塞操作。

recv() 函数是 TCP 网络编程中接收数据的基本工具。正确使用它需要考虑套接字的状态、缓冲区的大小以及可能的错误情况。


三、send()函数解析


send() 函数专用于
scoket 上的
write
操作,在套接字上发送数据的系统调用。

本质上是向发送缓冲区中写入数据,内核在发送
TCP 数据时,通常会使用
Nagle
算法把多个小的数据包合并成一个发送给另一端,以提高效率。

它是 TCP 网络编程中发送数据的基本工具之一。

以下是 send() 函数的详细解析:


(1)、函数原型

ssize_t send(int sockfd, const void *buf, size_t len, int flags);

(2)、参数

  • sockfd:套接字描述符,表示要从中发送数据的套接字。
  • buf:指向要发送数据缓冲区的指针。
  • len:要发送数据的长度,单位为字节。
  • flags:用来修改发送行为的选项。常用的值包括:
    • 0:正常发送数据。
    • MSG_DONTWAIT:使 send() 调用非阻塞。
    • MSG_MORE:暗示更多的数据要发送,可以用于优化传输效率。

(3)、返回值

  • 成功时,返回已发送的字节数,该值通常小于或等于 len
  • 失败时,返回 -1,并设置全局变量 errno 以指示错误类型。

(4)、错误处理

  • EAGAINEWOULDBLOCK:在非阻塞模式下,如果操作会阻塞,则返回此错误。

  • ECONNRESET:远程主机强行关闭了连接。

  • ENOTCONN:套接字未连接到任何远程主机。

  • ENOTSOCKsockfd 不是一个套接字。


(5)、使用场景

  • 主要用于已连接的 TCP 套接字上的数据发送。对于 UDP 套接字,通常使用 sendto() 函数。


(6)、阻塞和非阻塞行为

  • 默认情况下,send() 是阻塞的,它会等待直到数据被发送。

  • 对于非阻塞套接字,如果数据不能立即发送,send() 会返回 -1 并设置 errnoEAGAINEWOULDBLOCK


(7)、与 write() 的区别

  • write() 是一个通用的系统调用,用于写文件描述符,而 send() 专门用于套接字。

  • send() 可以处理套接字选项和状态,而 write() 不能。


(8)、示例代码

const char* message = "Hello, World!";
ssize_t nbytes = send(sockfd, message, strlen(message), 0);
if (nbytes < 0) {
    perror("send failed");
    exit(EXIT_FAILURE);
}

(9)、注意事项

  • 发送的数据可能因为网络或其他原因没有立即发送出去,send() 只是将数据交给了内核。
  • 对于非阻塞套接字,可以使用 select()poll() 来等待套接字变得可写。

send() 函数是 TCP 网络编程中发送数据的基础。正确使用它需要考虑套接字的状态、数据的长度以及可能的错误情况。此外,send()recv() 配合使用,可以实现完整的数据发送和接收流程。

需要注意的是,recv()和send()都可能出现中断或部分接收/发送的情况,因此在实际应用中需要循环调用,确保所有数据都被完整传输。此外,它们还有一些特殊的flags可以控制阻塞行为等,具体用法视实际情况而定。


四、权威之作待续


恭喜你已经完整学习了TCP 流式协议,什么是粘包?粘包如何处理?以及recv()和send()函数,这标志着你正在向Socket编程高手的行列迈进。当然,Socket编程远不止如此,还有select()、poll()等I/O复用函数、Unix域Socket编程、原始套接字编程等更高阶的技巧等待你去发掘。我们期待在不久的将来,为你呈现一部Socket编程的不朽权威之作。敬请期待!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1801346.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

c#与汇川plc通信 使用官网API库

前言 上位机开发中有时会要求与PLC进行通信&#xff0c;汇川官网也有好用的API库方便大家使用。记录一下开发过程。 1.下载资料 汇川官网地址&#xff1a;汇川技术 - 推进工业文明 共创美好生活 打开后选择&#xff1a;服务与支持-》资料下载-》 资料下载 这里可以直接搜索&am…

了解光伏储能技术的应用场景和优势

光伏发电是指利用太阳能电池板将太阳光转化为电能的过程。其优点在于清洁、高效、可再生&#xff0c;但光伏发电需要同时也存在间歇性和不稳定性问题。为了解决这一问题&#xff0c;光伏储能技术得到了广泛应用。其基本原理是将白天无法消耗的电能储存起来&#xff0c;以供需要…

Tensorflow音频分类

tensorflow https://www.tensorflow.org/lite/examples/audio_classification/overview?hlzh-cn 官方有移动端demo 前端不会 就只能找找有没有java支持 注意版本 注意JDK版本 package com.example.demo17.controller;import org.tensorflow.*; import org.tensorflow.ndarra…

数据库-列的完整性约束-概述

引言 我们都知道人以群分 &#xff0c;但分为 若按照 人类的皮肤分类 黄种人&#xff08;其实是西方人定义&#xff09;我们虽然不承认也不否定 &#xff0c;黑皮肤 &#xff0c;棕色人种&#xff08;在南太平洋和西太&#xff09;白种人 排名你懂的 这好像是枚举类型 emm 尴尬…

数组中寻找符合条件元素的位置(np.argwhere,nonzero)

今天遇到一个问题&#xff0c;就是寻找符合条件的元素所在的位置&#xff0c;主要使用np.argwhere和nonzero函数 比如给我一个二维数组&#xff0c;我想知道其中元素大于15的位置 方法1 import numpy as np exnp.arange(30) enp.reshape(ex,[3,10]) print(e) print(e>15…

SwiftUI中Mask修饰符的理解与使用

Mask是一种用于控制图形元素可见性的图形技术&#xff0c;使用给定视图的alpha通道掩码该视图。在SwiftUI中&#xff0c;它类似于创建一个只显示视图的特定部分的模板。 Mask修饰符的定义&#xff1a; func mask<Mask>(alignment: Alignment .center,ViewBuilder _ ma…

51单片机-LCD液晶显示

目录 前言: 一. LCD1602模块简介 二. 代码功能实现 三.总结 前言: 本文主要是51单片机的LCD液晶显示,使用的是LCD1602.下面是详细介绍和完整代码,欢迎大家的点赞,评论和关注.感谢. 一. LCD1602模块简介 LCD1602 模块具有以下特点&#xff1a; 显示特点&#xff1a; 可以…

Linux系统之部署Blog-Index导航页

Linux系统之部署Blog-Index导航页 一、Blog-Index介绍1.1 Blog-Index简介1.2 Blog-Index特点1.3 Blog-Index使用场景 二、本地环境介绍2.1 本地环境规划2.2 本次实践介绍2.3 Yarn介绍 三、检查本地环境3.1 检查本地操作系统版本3.2 检查系统内核版本3.3 检查系统是否安装yarn 四…

通过调用栈快速探究 Compose 中 touch 事件的处理原理

前言 Compose 视图的处理方式和 Android 传统 View 有很大差别&#xff0c;针对 touch 事件的处理自然也截然不同。 如何在 Compose 中处理 touch 事件&#xff0c;官方已有非常详尽的说明&#xff0c;可以参考&#xff1a;https://developer.android.google.cn/jetpack/comp…

[图解]企业应用架构模式2024新译本讲解11-领域模型4

1 00:00:00,160 --> 00:00:01,870 好&#xff0c;到这里的话 2 00:00:02,620 --> 00:00:05,060 文字处理器的产品对象就生成了 3 00:00:06,880 --> 00:00:09,180 同样下面就是电子表格 4 00:00:10,490 --> 00:00:11,480 电子表格也同样的 5 00:00:11,490 -->…

【Vue】——组件的注册与引用

&#x1f4bb;博主现有专栏&#xff1a; C51单片机&#xff08;STC89C516&#xff09;&#xff0c;c语言&#xff0c;c&#xff0c;离散数学&#xff0c;算法设计与分析&#xff0c;数据结构&#xff0c;Python&#xff0c;Java基础&#xff0c;MySQL&#xff0c;linux&#xf…

【Java面试】九、微服务篇-SpringCloud(上)

文章目录 1、SpringCloud五大组件2、服务注册和发现2.1 Eurake2.2 Eurake和Nacos的区别 3、Ribbon负载均衡3.1 策略3.2 自定义负载均衡策略 4、服务雪崩与熔断降级4.1 服务雪崩4.2 服务降级4.3 服务熔断 5、服务限流5.1 Nginx限流5.2 网关限流 6、微服务监控7、面试 1、SpringC…

antd vue a-select 搜索

数据结构 list: [{ name: "序号", id: 0, show: true },{ name: "出库单编号", id: 1, show: false },{ name: "wbs元素", id: 2, show: true },{ name: "序号1", id: 3, show: true },{ name: "出库单编号1", id: 4, show…

每天五分钟深度学习pytorch:pytorch中的广播机制是什么?

本文重点 在pytorch中经常有张量和张量之间的运算,那么有一点需要注意,那就是维度要匹配,如果维度不匹配就有可能出现问题。如果维度不一致,此时也可以同时进行操作,此时就需要使用pytorch中的广播机制,本节课程就讲解pytorch中的广播机制。 广播机制示意图 如上就是py…

基于C#的计算机与安捷伦34970A通信方法

概述 安捷伦34970A采集数据&#xff0c;34970A支持RS232接口&#xff0c;但是如果直接用winform自带的seriaport类基本是没必要使用的&#xff0c;安捷伦等仪表通讯需要用到VISA的库。 库的获取 1. 是德科技的IO Library. 2. NI下载NI-VISA. 两者用法接近. 代码如下 using…

【数据分析基础】实验numpy、pandas和matplolib

文件score.xlsx 中存放了学生的各个科目的考试成绩&#xff08;如下图&#xff09;&#xff0c; 1. 编程实现&#xff1a;输入任意一个学号&#xff0c;将该学号对应的成绩&#xff0c;通过雷达图显示。 &#xff08;1&#xff09;程序代码&#xff1a; import pandas as pd…

在Java中使用SeleniumAPI,超详细

Java中 Selenium相关操作 1 定位元素 1.1 css选择器定位元素 就是定位到页面的元素&#xff0c;本质上就是一个一个的语法 下面举几个具体的例子&#xff1a; 类选择器 按照给定的 class 属性的值&#xff0c;选择所有匹配的元素。 语法&#xff1a;.classname 例子&am…

【中篇】从 YOLOv1 到 YOLOv8 的 YOLO 物体检测模型历史

YOLO 型号之所以闻名遐迩,主要有两个原因:其速度和准确性令人印象深刻,而且能够快速、可靠地检测图像中的物体。上回我解释了Yolo v1, 今天从Yolov2开始。 YOLOv2:更好、更快、更强 2017 年 7 月一个闷热的星期二下午,雷德蒙(Joseph Redmon, Yolo创始人)再次走上舞台。 …

MASA:匹配一切、分割一切、跟踪一切

摘要 在复杂场景中跨视频帧稳健地关联相同对象是许多应用的关键&#xff0c;特别是多目标跟踪&#xff08;MOT&#xff09;。当前方法主要依赖于标注的特定领域视频数据集&#xff0c;这限制了学习到的相似度嵌入的跨域泛化能力。我们提出了MASA&#xff0c;一种新颖的方法用于…

嵌入式Linux系统编程 — 3.1 Linux系统中的文件类型

目录 1 Linux 系统中的文件类型简介 2 普通文件 2.1 什么是普通文件 2.2 普通文件分类 3 目录文件 4 字符设备文件和块设备文件 4.1 什么是设备文件 4.2 查看设备文件的方法&#xff1a; 5 符号链接文件&#xff08;link&#xff09; 5.1 什么是符号链接文件 5.2 如…