socket 到底是个啥

news2025/1/22 15:58:36

在这里插入图片描述
哈喽大家好,我是咸鱼

我相信大家在面试过程中或多或少都会被问到这样一个问题:你能解释一下什么是 socket 吗

我记得我当初的回答很是浅显:socket 也叫套接字,用来负责不同主机程序之间的网络通信连接,socket 的表现方式由四元组(ip地址:端口)组成

那么今天,咸鱼将跟大家打开 socket 的神秘大门,不但要搞清楚 socket 的概念,最好还能够了解它的底层实现

我们首先查看一下 socket 的翻译
在这里插入图片描述
我们看到,socket 可以翻译成插座、插头,那现在请想象这么一个场景:给手机充电时,你将充电插头插入电源插座里面,是不是意味着插座与充电插头连接起来了

在计算机世界中,socket 翻译成套接字,通过 socket 我们可以与某台服务器进行连接,而建立连接的过程,你可以脑补成将充电插头插进插座的过程
在这里插入图片描述
在这里插入图片描述

socket 使用场景

假设我们想要将数据从 A 电脑的某个进程传送到 B 电脑的某个进程(比如咸鱼用微信发信息给冰冰)

在这里插入图片描述
那么在与对方聊天的过程中,其实就是这两台电脑中的微信进程相互传输数据的过程

在这个过程中,两台电脑各自调用 socket 方法,然后会得到一个 fd 句柄(socket_fd),这个 fd 句柄就相当于 socket 的身份证号

socket_fd = socket.socket(socket.AF_INET,socket.SOCK_STREAM)

得到 fd 句柄之后:

  1. 服务端执行 bind()、listen()、accept() 方法等待客户端建立连接的请求
  2. 客户端执行 connect() 方法向服务端发起连接
  3. 连接建立起来之后,两端都可以执行 send()、recv() 方法来互相传递数据

PS:对于不同的传输层协议,上面这个过程是不一样的,详情可以查看我之前的文章《python 网络编程》

TCP 协议
在这里插入图片描述
UDP 协议
在这里插入图片描述

socket 设计

我们知道了 socket 是用来实现网络传输功能的,它负责不同主机进程之间的网络通信连接

我将上面的问题改一下,把 ”socket 是什么“ 改成 ”如果让你来实现一个网络传输功能,你会怎么设计“

网络传输功能,简单点来讲就是两端服务器之间进行网络通信并互相收发数据,收发数据也就是读写数据
在这里插入图片描述
首先我们会遇到第一个问题:茫茫互联网中你怎么能找到那台梦中情机

聪明的你肯定会想到——ip地址!我们用 ip 地址来定位电脑

找到了你的梦中情机之后,你会发现,一台电脑上面这么多进程,我怎么才能找到与我通信的那个进程(比如说微信)

聪明的你很快就想到了用端口号(port)

可以这么理解,ip 地址是用来定位街区的,而端口号 port 对应这个街区中的门牌号,通过 ip +port 的组合,你可以在茫茫互联网中找到属于你的梦中情机并且与之通信

所以你在设计网络传输功能初期,定义了一个数据结构 sock,sock 里面包含了 ip 和 port 字段(假设用 C 语言实现)
在这里插入图片描述
在 Linux 中(以 CentOS 7举例),在头文件/usr/include/netinet/in.h可以看到负责套接字地址的 sock 结构体
在这里插入图片描述

sin_family 字段为 AF_INET,sin_port 表示端口号,sin_addr 表示 IPv4 地址,是一个 struct in_addr 类型的结构体

sin6_family 字段为 AF_INET6,sin6_port 表示端口号,sin6_addr 表示 IPv6 地址,是一个 struct in6_addr 类型的结构体

解决了定位问题之后,我们知道在计算机网络中有很多协议,这些协议规定了计算机之间的通信方式

比如你是选用可靠的 TCP 协议去进行网络通信,还是相对不可靠的 UDP 协议
在这里插入图片描述
不同的网络协议还对应着不同的网络通信场景,如果你选择了 TCP协议,你还得考虑例如滑动窗口、超时重传这些场景

所以有了 ip 和 port 还不行,你还需要定义新的数据结构用来维护网络协议以及对应的网络场景

又因为不同的网络协议中有一些功能相似的方法(例如收发数据),于是你决定将不同协议中的公共的部分提取出来,通过”继承“的方式来实现功能复用

所以可以先定义一个名为 sock 的数据结构,然后定义”继承“ sock 的各类 sock

**PS:Linux 内核是用 C 语言实现的,在 C 语言中没有继承这个概念,你可以简单将这个继承理解成 xx_sock 基于 sock 进行了扩展,xx_sock 是 sock 的进阶版 **
在这里插入图片描述

  • sock:最基础的结构,用来维护任何网络协议都会用到的收发数据缓冲区(公用部分)
  • inet_sock:负责网络传输功能的 sock,在 sock 基础上加了 TTL(网络生存时间)、ip 地址和端口号这些跟网络传输相关的字段信息
  • inet_connection_sock:面向连接的 sock,在 inet_sock 基础上添加了面向连接的协议里相关字段,比如 accept 队列,数据包分片大小,握手失败,重试次数等;虽然我们现在提到面向连接的协议就是指 TCP,但从设计上 Linux 需要支持扩展其他面向连接的新协议,比如 SCTP 协议,所以说 tcp_sock 则是在这个基础上实现的真正的 TCP 协议专用 sock 结构

上面例子中的这些 sock 都可以在系统上直接找到,以 CentOS 7 为例

#inet_sock
/usr/src/kernels/内核版本.debug/include/net/inet_sock.h

#inet_connection_sock
/usr/src/kernels/内核版本.debug/include/net/inet_connection_sock.h

在这里插入图片描述
现在你用代码实现了这一堆数据结构——sock,不同的 sock 分别实现自己职责内的功能(负责面向连接的数据结构 inet_connection_sock、负责 UDP 协议的数据结构 udp_sock 等等)

但是你需要这些 sock 去跟硬件网卡交互才能实现网络传输的功能,既然需要跟硬件交互,那就说明需要比较高的操作系统权限

同时考虑到性能和安全,这套数据结构不能放在用户态,需要给它放到系统内核里面

既然这套数据结构在内核里,处在用户态的程序想要用这套数据结构来实现网络传输功能该怎么办呢?

除此之外,处在用户态的程序并不关心也不知道你这套数据结构在底层内核是怎么操作的,功能是怎么实现的,它只关心结果

于是你想到了用接口调用的方式——你将一个个功能抽象一个个接口,以后别人只需要调用这些接口,就可以让内核中这一大堆复杂的数据结构去实现指定功能

又因为在 Linux 中一切皆文件,你索性将这些 sock 封装成文件,当用户态的程序去调用你提供的接口时,需要先创建一个 sock 文件

这个新生成的 sock 文件有一个文件句柄 fd,用户态的程序只需要拿着这个 fd 就可以对内核中的 sock 进行操作

# sock 文件句柄 socket_fd
socket_fd = socket.socket(socket.AF_INET,socket.SOCK_STREAM)

在这里插入图片描述
上面有说到,你将不同的数据结构(inet_socktcp_sock 等等)抽象成一个个 API 接口,以后别人只需要调用这些 API 接口就可以驱动我们写好的这一大堆复杂的数据结构去进行网络传输

下面列出了一些常见的接口:

  • send
  • recv
  • bind
  • listen
  • connect

到这里,整个网络传输功能就已经基本实现了。上面列举出来的这些方法,其实就是 socket 提供出来的接口

到这里,我们对 socket 有了一个更深的了解——socket 其实相当于一个接口层,它处在内核态和用户态之间:

  • 向上用户态
    • 为处在用户态的程序提供 API 接口,方便用户态程序实现网络传输功能
  • 向下内核态
    • 对网卡进行操作,负责网络传输工作

或者你也可以这么理解,处在用户态的程序通过 socket 提供的接口,将网络传输的这部分工作外包给了 Linux 内核
在这里插入图片描述
我们以 tcp 协议为例子来看下 python 中是如何操作 socket 的

  • 客户端
#创建一个 socket 并获得 socket 文件的句柄
socket_fd = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

#调用 connect 接口进行连接
socket_fd.connect(('127.0.0.1', 9999))

#调用 send 接口进行数据传输
socket_fd.send(data)

#调用 close 接口关闭 socket
socket_fd.close()

在客户端中,程序首先调用 socket 提供的 socket 方法创建一个 socket 文件来获得 socket 句柄,然后调用 connect 方法,这时候内核会根据 socket_fd 找到对应的 sock 文件

再根据文件里的信息找到处在内核的 sock 结构,通过 sock 结构与服务端进行三次握手建立连接

连接建立好之后,客户端调用 send 方法来进行数据传输,sock 中定义了一个发送缓冲区和接收缓冲区,其实就是一个链表,链表上面放着一个个等待发送或接收的数据

总结

我们再次回到那个问题——socket 是什么?

sock(或 socket)是操作系统内核提供的一种数据结构,用于实现网络传输功能

基于不同的网络协议以及应用场景,衍生了各种类型的 sock,每个网络层协议都有相应的 sock 结构体来管理该层协议的连接状态和数据传输。各类 sock 操作硬件网卡,就实现了网络传输的功能

为了将这些功能让处在用户态的应用程序使用,不但引入了 socket 层,还将各类功能的实现方式抽象成了 API 接口,供应用程序调用

同时将 sock 封装成文件,应用程序就可以在用户层通过文件句柄(socket fd)来操作内核中 sock 的网络传输功能

这个 socket fd 是一个 int 类型的数字,而 socket 中文翻译叫做套接字,结合这个 socket fd,你是不是可以将其理解成:一套用于连接的数字

而 socket 分 Internet socket 和 UNIX Domain socket,两者都可以用于不同主机进程间的通信和本机进程间的通信,只是前者采用的是基于 IP 协议的网络通信方式,而后者采用的是基于本地文件系统的通信方式

关于 UNIX Domain socket,可以通过 netstat -x 查看
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/414118.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

整柜海运到美国的规格和收费标准是什么

整柜海运是指将所有货物安装在一个整箱内,由发货人和收货人共同操作,而目的港的收货人一般只有一个,方便操作。整柜海运到美国的主要流程有以下几个步骤:订舱、装柜、报关、海运、清关、提柜和送货。实际上,国际物流出…

IDEA 2023.1 最新变化

IntelliJ IDEA 2023.1 最新变化 在 IntelliJ IDEA 2023.1 中,我们根据用户的宝贵反馈对新 UI 做出了大量改进。 我们还实现了性能增强,从而更快导入 Maven,以及在打开项目时更早提供 IDE 功能。 新版本通过后台提交检查提供了简化的提交流程…

写博客8年与人生第一个502万

题记:我们并非生来强大,但依然可以不负青春。 原本想好好写一下如何制定一个目标并通过一点一滴的努力去实现,这三年反思发现其实写自己的经历并不重要。 很多人都听过一句话:榜样的力量是无穷的。 更现实和实际的情况是&#x…

【LeetCode】每日一题:移除元素

目录 题目: 思想1:暴力解法 思想2:创建一个temp数组 思想3:双指针 👻内容专栏:《LeetCode刷题专栏》 🐨本文概括:27.移除元素 🐼本文作者:花 碟 &#x1…

电商评论数据爬取--R语言

1.网络爬虫 1.1 什么是网络爬虫 网络爬虫(web crawler),也被称为网络蜘蛛(web spider),是在万维网浏览网页并按照一定规则提取信息的脚本或者程序。 浏览网页时,一般流程如下: 利…

C++语法(17)---- 二叉搜索树

1.概念 1.父节点的左子树全小于本身 2.父节点的右子树全大于本身 3.左右子树也是二叉搜索树 时间复杂度:O(N),有可能只有左数,这样就遍历了所有,所有复杂度为N 平衡二叉树的时间复杂度才是:O(logN) 2.模拟 1.数据元素…

Postman抓包教程

目录 什么是抓包? 如何使用 Postman 进行抓包 查看历史抓包数据 使用抓包数据进行接口测试和开发 抓包技巧和注意事项 什么是抓包? 在计算机网络中,抓包是指捕获网络流量的过程。抓包工具可以截获进出计算机网络的数据流,并将…

反向传播推导+numpy实现

很久没有看深度学习了,忘了好多东西。本来想着推导一下,后来发现自己不会了。 再看看以前写的代码,又避开了最终的东西,于是决定重新推导一下。 数据的说明 首先,我们要做一个回归的任务,我们使用numpy随…

5.Java循环控制语句

Java循环控制语句 循环是Java中应用最为广泛的一个知识点,所以也是很需要掌握的。所谓循环,即通过判断条件,重复执行一段代码,根据条件的变化,来确定代码是否执行,执行次数。 一、循环结构 1、while循环…

Java IO常用操作详解(代码示例)

概览 Java I/O操作指的是数据的输入/输出操作。 Java的I/O操作类在java.io包中,主要分以下几种: 基于字节操作的I/O接口: InputStream和OutputStream基于字符操作的I/O接口: Writer和Reader基于磁盘操作的I/O接口: …

5个令人惊艳的AI项目,开源了。。

大家好,我是 Jack。 今天清明,小伙伴们都去哪里玩了? 上个月我已经出去浪过了,清明就老实在家歇着了。 翻看了一些最近热点的开源项目,发现还是 AIGC 的天下。 今天,我将继续着重挑选几个近期的优质开源…

2023第十四届蓝桥杯C++B组菜鸡的落幕

时隔几天,终于还是忍不住来复盘一下蓝桥杯了,还记得去年参加做下填空,再做对个把编程,后面不会的大题打打表混混分,最后就能混个省奖, 这回估计凉透了,填空没对似乎,编程也没对几个,…

Kettle8.2.0连接Hive3.1.2(踩坑,亲测有效)

这是目前遇到的最简单但最头疼的安装,因为是在公司之前用过的服务器上进行安装测试,加上又使用比较新的版本,结果踩了不少坑。Kettle连接Hive这个坑,从2023年4月11日下午开始,一致到2023年4月12日中午才弄好&#xff0…

uni-app常用配置

保存自动格式化 工具》设置》编辑器设置》保存时自动格式化 JS语法检查 安装eslint-js插件eslint-js - DCloud 插件市场 用于校验js和html中的js代码https://ext.dcloud.net.cn/plugin?id2037工具》设置》插件配置》eslint-js 启用实时校检 Vue语法检查 安装eslint-vue插…

【星界探索——通信卫星】铱星:从“星光坠落”到“涅槃重生”,万字长文分析铱星卫星系统市场

【星界探索——通信卫星】铱星:从“星光坠落”到“涅槃重生”一、铱星简介二、铱星系统设计思路2.1 工作原理2.2 铱星布局三、铱星优势四、发展历程五、第一代铱星公司的破产原因分析5.1 终端和资费价格高昂,市场用户群体小5.2 财务危机5.3 市场分析不足…

一文吃透低代码平台源代码交付的重要性(避坑指南)

一、前言 作为这两年IT界的风口,低代码在众人眼里已经不是什么陌生的概念。 对标于传统的纯代码开发,低代码是一种快速开发软件(应用程序)的方法,平台通过对大量功能与场景做提前封装,使得用户可以在可视…

MySQL开发05-MySQL开发规范

文章目录1、命名规范2、表设计规范3、索引规范4、SQL语句规范5、SQL脚本规范6、数据架构规范7、配置文件建议8、其他规范9、总结1、命名规范 命名应有意义,包括库名、表名、用户名等,以使用方便记忆、描述性强的可读性名称为第一准则,尽量避…

Docker网络案例

bridge 是什么 Docker 服务默认会创建一个 docker0 网桥(其上有一个 docker0 内部接口),该桥接网络的名称为docker0,它在内核层连通了其他的物理或虚拟网卡,这就将所有容器和本地主机都放到同一个物理网络。Docker 默认指定了 docker0 接口 的 IP 地址和子网掩码,让主机…

C#基础复习

语句 目录 语句 switch: 跳转语句 标签语句 标签: 标签语句的作用域 goto语句 using 语句 资源的包装使用 using 语句示例: 多个资源和嵌套 语句是描述某个类型或让程序执行某个动作的源代码指令 块在语法上算作一个单条嵌入语句。任何语…

【cmake学习】搭建一个简单的cmake工程(初级版)

目录 1、工程框架介绍 2、编写CMakeLists.txt (1) 限制cmake最低版本、工程命名 (2) 引入头文件目录 (3) 引入库目录(可选) (4) 引入源文件 (5) 生成可执行文件 / 生成动静态库 (6) 链接库文件(可选) 3、完整CMakeLists…