Linux网络协议之UDP协议(传输层)
文章目录
- Linux网络协议之UDP协议(传输层)
- 1.深入理解传输层
- 1.1 对于端口号的理解
- 1.2 端口号范围
- 1.3 常用的知名端口号
- 1.4 进程和端口号的两个问题
- 1.5 查看网络状态命令(netstat)
- 2.UDP协议
- 2.1 UDP协议格式
- 2.2 UDP的特点
- 2.3 面向数据报
- 2.4 UDP的缓冲区
- 2.5 基于UDP协议的应用层协议
- 2.6 UDP使用注意事项
- 2.7 UDP在内核中的实现
- 2.8 16位的UDP校验原理
1.深入理解传输层
1.1 对于端口号的理解
传输层是负责端对端之间的传输,
端指的是端口(port)
;TCP协议和UDP协议都是传输层的协议
- 端口(Port)标识一个主机上进行网络通信的不同的应用程序。当主机从网络中获取到数据后,需要自底向上进行数据的交付,而这个数据最终应该交给上层的哪个应用处理程序,就是由该数据当中的目的端口号来决定的
- 从网络中获取的数据在进行向上交付时,在传输层就会提取出该数据对应的目的端口号,进而确定该数据应该交付给当前主机上的哪一个服务进程
- 端口号如何找到进程?内核实现通过哈希算法,端口号对应进程PID
在TCP/IP协议中, 用 “源IP地址”, “目标IP地址”, “协议号”, “源端口号”,"目标端口号"
这样一个五元组来标识一个通信(可以通过netstat -n查看)
- 源IP地址:发送数据的主机IP
- 目标IP地址:最终接收数据主机IP
- 源端口号:发送数据主机中发送数据的进程
- 目标端口号:最终接收数据主机中要接收数据的进程
1.2 端口号范围
- 0 - 1023: 知名端口号, HTTP, FTP, SSH等这些广为使用的应用层协议, 他们的端口号都是固定的
- 1024 - 65535: 操作系统动态分配的端口号。客户端程序的端口号, 就是由操作系统从这个范围分配的
1.3 常用的知名端口号
有些服务器是非常常用的, 为了使用方便, 人们约定一些常用的服务器, 都是用以下这些固定的端口号
SSH服务器:使用22端口号
FTP服务器:使用21端口号
Telnet服务器:使用23端口号
HTTP服务器:使用80端口号
HTTPS服务器:使用443端口号
使用命令 cat /etc/services 可以查看指明端口号
说明一下: 文件中的每一行对应一种服务,它由4个字段组成,每个字段之间用TAB或空格分隔,分别表示“服务名称”、“使用端口”、“协议名称”以及“别名”
一点提醒:一个进程可以绑定多个端口号,一个端口号只能绑定一个进程
1.4 进程和端口号的两个问题
第一个问题:一个端口号是否可以被多个进程绑定?
- 一个端口号绝对不能被多个进程绑定,因为端口号的作用就是唯一标识一个进程,如果绑定一个已经被绑定的端口号,就会出现绑定失败的问题
第二个问题:一个进程是否可以绑定多个端口号?
- 一个进程是可以绑定多个端口号的,这与“端口号必须唯一标识一个进程”是不冲突的,只不过现在这多个端口唯一标识的是同一个进程罢了
- 我们限制的是从端口号到进程的唯一性,而没有要求从进程到端口号也必须满足唯一性,因此一个进程是可以绑定多个端口号的
总结:一个进程可以绑定多个端口号,一个端口号只能绑定一个进程
1.5 查看网络状态命令(netstat)
netstat
是一个用来查看网络状态的重要工具
其常见的选项如下:
- n 拒绝显示别名,能显示数字的全部转化成数字
- l 仅列出有在 Listen (监听) 的服務状态
- p 显示建立相关链接的程序名
- a (all)显示所有选项,默认不显示LISTEN相关
- u (udp)仅显示udp相关选项
- t (tcp)仅显示tcp相关选项
一些其他命令补充:
iostat
命令:主要用于输出磁盘IO和CPU的统计信息
其常见的选项如下:
- c:显示CPU的使用情况
- d:显示磁盘的使用情况
- N:显示磁盘列阵(LVM)信息
- n:显示NFS使用情况
- k:以KB为单位显示
- m:以M为单位显示
- t:报告每秒向终端读取和写入的字符数和CPU的信息
- V:显示版本信息
- x:显示详细信息
- p:显示磁盘分区的情况
我们来试下这个命令,比如我们要查看磁盘IO和CPU的详细信息
CPU属性值说明:
- %user:CPU处在用户模式下的时间百分比
- %nice:CPU处在带NICE值的用户模式下的时间百分比
- %system:CPU处在系统模式下的时间百分比
- %iowait:CPU等待输入输出完成时间的百分比
- %steal:管理程序维护另一个虚拟处理器时,虚拟CPU的无意识等待时间百分比
- %idle:CPU空闲时间百分比
pidof
命令:可以通过进程名,查看进程id
例如,我们用
pidof
命令查看我们自己编写的一个死循环进程:
pidof
命令可以配合kill
命令快速杀死一个进程
ipconfig
命令:用于显示或者设置网络设备
一点解释:
- inet:IP地址
- netmask:子网掩码
- vroadcast:广播
- ether:以太网
2.UDP协议
2.1 UDP协议格式
内核中的UDP报头结构定义:
- 16位源端口:数据从哪一个端口发出来的,也就是数据从哪一个进程发送出来的
- 16位目的端口:数据想要到哪一个端口去,也就是数据想要去往哪一个进程
- 16位UDP长度:表示整个数据报(UDP头部+UDP数据)的最大长度
- 16位的UDP校验和:校验数据在传输过程中是否失真,数据在传输的过程中需要经过很多链路设备,如果在转发过程中有某个字节损坏,就相当于整个这个数据失真了,如果UDP接收方校验和出错,就会直接将数据丢弃掉,且不会通知发送方
- 如果校验和出错, 就会直接丢弃
16位能够表示的数据最大位长度位2^16=65536—>指的是UDP数据的最大长度
网络每一层主要都要解决两个问题:
第一个问题:如何做到数据和报头的有效分离?
- UDP报头是定长的8字节,可以将报头分离。报头的16位UDP长度减去8字节,就是数据长度
第二个问题:如何做到向上交付给什么谁?
- 传输层向上交付,交付给应用层,实际是交付给应用层的某个进程,目的端口号确认交付给哪个进程
2.2 UDP的特点
UDP传输的过程类似于寄信,其特点如下:
无连接
: 知道对端的IP和端口号就直接进行传输, 不需要建立连接不可靠
: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方, UDP协议层也不会给应用层返回任何错误信息面向数据报
: 不能够灵活的控制读写数据的次数和数量
注意:报文在网络中进行路由转发时,并不是每一个报文选择的路由路径都是一样的,因此报文发送的顺序和接收的顺序可能是不同的
2.3 面向数据报
应用层交给UDP多长的报文, UDP原样发送, 既不会拆分, 也不会合并
用UDP传输100个字节的数据:
如果发送端调用一次sendto, 发送100个字节, 那么接收端也必须调用对应的一次recvfrom, 接收100个字节; 而不能循环调用10次recvfrom, 每次接收10个字节
2.4 UDP的缓冲区
UDP的socket既能读, 也能写, 这个概念叫做全双工
UDP缓冲区:
- 发送缓冲区:将应用层提交给传输层的应用数据打上UDP报头之后就提交给网络层继续传输
- 接收缓冲区:去掉UDP报头之后,将数据递交给应用层,UDP并不保证数据的可靠,以及有序
对于UDP的理解:
- UDP没有真正意义上的 发送缓冲区。调用sendto会直接交给内核, 由内核将数据传给网络层协议进行后续的传输动作
- 发送缓冲区:将应用层数据打上UDP报头后直接递交给网络层
- UDP具有接收缓冲区,但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致; 如果缓冲区满了, 再到达的UDP数据就会被丢弃
- 接收缓冲区:去掉UDP报头后将数据递交给应用层
- UDP协议并不保证数据的有序到达
2.5 基于UDP协议的应用层协议
- NSF:网络文件系统
- TFTP:简单文件传输协议
- DHCP:动态主机配置协议
- BOOTP:启动协议(用于无盘设备启动)
- DNS:域名解析协议
- 也包括自己写UDP程序时自定义的应用层协议
2.6 UDP使用注意事项
UDP包头中UDP最大长度只有16位,说明UDP能够传输的数据最大的长度是64k(包括报头)
如果我们需要传输的数据超过64k,就需要在应用层手动进行分包,多次发送,并且在接收端手动拼装
2.7 UDP在内核中的实现
如何进行数据拼接?只需要用udphdr定义变量,在和数据进行拼接即可。(比如memcopy)
2.8 16位的UDP校验原理
结论:发送方进行填充,接收方进行校验
对接收方:进行校验
如果校验成功(对所有16个比特位相加和全为1),会将数据交给应用层
如果校验失败,即使数据已经到达了接收方传输层的UDP协议,也会被丢弃,有可能在传输的过程中失真
对发送方:发送填充
- 将除了校验的16位比特位,其余的按照16个比特位相加,在相加的过程中如果出现比特位超过16位的情况需要进行回卷
- 回卷的策略:最高位+低16位 计算出来的新值
- 加完的结果进行反码运算
- 将反码运算的结果放到16位的校验和当中