udp协议篇
- 一、本篇是在应用篇的后面的
- 二、传输层
- 2.1、再谈端口号
- 2.2.1、两个问题
- 2.2.2、两个常用命令
- 2.2、UDP协议
- 2.2.1、udp协议端格式&&理解报头
- 2.2.2、udp的特点
- 2.2.3、udp的缓冲区
- 2.2.4、基于udp的应用层协议
一、本篇是在应用篇的后面的
讲解过程是自顶向下的,可以先看看应用层
应用层HTTP协议篇的的传送位置
二、传输层
2.1、再谈端口号
端口号(port)标识了一个主机上进行通信的不同的应用程序。
在TCP/IP协议中, 用 “源IP”, “源端口号”, “目的IP”, “目的端口号”, “协议号” 这样一个五元组来标识一个通信(可以通过netstat -n
查看,具体还需要加别的参数);
- 客户端A上面两个浏览器请求,客户端B上面一个浏览器请求,这三个请求同时请求访问服务器上的80端口号应用程序
- 五元组由此建立,根据"源IP", “源端口号”, “目的IP”, “目的端口号”, "协议号"形成报头,封装在数据内容的首部进行传输,通过五元组识别通信。
端口号范围划分
-
0 - 1023: 知名端口号, HTTP, FTP, SSH等这些广为使用的应用层协议, 他们的端口号都是固定的.
-
1024 - 65535: 操作系统动态分配的端口号. 客户端程序的端口号, 就是由操作系统从这个范围分配的
认识知名端口号
有些服务器是非常常用的, 为了使用方便, 人们约定一些常用的服务器, 都是用以下这些固定的端口号:
- ssh服务器, 使用22端口
- ftp服务器, 使用21端口
- telnet服务器, 使用23端口
- http服务器, 使用80端口
- https服务器, 使用443
cat /etc/services
或者
vim /etc/services
执行上面的任一命令都可以查看知名的端口号,
我们自己写一个程序使用端口号时, 要避开这些知名端口号
2.2.1、两个问题
- 一个进程是否可以bind多个端口号?
- 一个端口号是否可以被多个进程bind?
- 问题一:可以,端口号保证的是唯一性,一个程序需要同时监听不同的端口,在web端很常见,每种协议的端口号各不相同,一个程序的执行可能需要很多的协议来保证通信传输。
- 问题二:不可以,端口号必须唯一的被一个进程bind,保证唯一性,当一个进程成功bind了一个端口号后,其他进程就不能再使用相同的端口号。如果另一个进程试图使用已被占用的端口号,那么操作系统会返回一个错误并提示端口号已经被占用。
2.2.2、两个常用命令
netstat
netstat是一个用来查看网络状态的重要工具
语法: netstat [选项]
功能:查看网络状态
常用选项:
- n 拒绝显示别名,能显示数字的全部转化成数字
- l 仅列出有在 Listen (监听) 的服務状态
- p 显示建立相关链接的程序名
- t (tcp)仅显示tcp相关选项
- u (udp)仅显示udp相关选项
- a (all)显示所有选项,默认不显示LISTEN相关
pidof
在查看服务器的进程id时非常方便
语法: pidof [进程名]
功能:通过进程名, 查看进程id
2.2、UDP协议
2.2.1、udp协议端格式&&理解报头
- 前8个字节各部分16位的原因是Linux操作系统用的是16位的,所以应用层也传16位
uint16_t
的数据 - 16位UDP长度, 表示整个数据报(UDP首部+UDP数据)的最大长度;
- 如果校验和出错, 就会直接丢弃;
2.2.2、udp的特点
UDP传输的过程类似于寄信
- 无连接: 知道对端的IP和端口号就直接进行传输, 不需要建立连接;
- 不可靠: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方, UDP协议层也不会给应用层返回任何错误信息;
- 面向数据报: 不能够灵活的控制读写数据的次数和数量;
- 所谓无连接就是没有tcp那样的监听,建立连接等等一系列通信前摇,上来知道了ip和端口号直接就发
- 所谓的不可靠就是,我把数据交给你了之后我就不管了,应用层传入的数据,交给传输层,然后网络。。。不考虑数据的丢失,不考虑怎么解决丢包,怎么传输
- 所谓的面向数据报,就是应用层发给udp一个报文,udp原样发送,你给我传多少,我给下一层传多少,不会拆分,不会合并,发给udp100字节,udp直接读取100字节,而不是分10次读取10字节,丢包就是没有数据。
2.2.3、udp的缓冲区
-
UDP没有真正意义上的 发送缓冲区. 调用sendto会直接交给内核, 由内核将数据传给网络层协议进行后续的传输动作;
-
UDP具有接收缓冲区. 但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致; 如果缓冲区满了, 再到达的UDP数据就会被丢弃
- tcp的server端和client端都有发送缓冲区和接收缓冲区,数据的发送本质是拷贝数据,把数据拷贝给缓冲区,就可以继续工作,数据的发送交给缓冲区了,数据的接受也从缓冲区中拷贝过来,用生产者消费者模型的思想完成IO操作的解耦,使数据传输更为高效。
- 而udp是有多少发多少,不需要发送缓冲区,只有接收缓冲区,由于数据的发送不可靠,自然缓冲区中的顺序也就不可靠,当然也有丢包问题的存在,至于缓冲区满的时候就直接丢弃。
UDP的socket既能读, 也能写, 这个概念叫做 全双工
- 半双工:发送方和接收方之间只能一个发送一个接受
- 全双工:发送方和接收方能够同时发送和接受,也就是a同时发送给b,也接收b的数据,b发给a数据,也同时接收a的数据,这就叫做全双工
UDP使用注意事项
我们注意到, UDP协议首部中有一个16位的最大长度. 也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部).
然而64K在当今的互联网环境下, 是一个非常小的数字.
如果我们需要传输的数据超过64K, 就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装;
2.2.4、基于udp的应用层协议
- NFS: 网络文件系统
- TFTP: 简单文件传输协议
- DHCP: 动态主机配置协议
- BOOTP: 启动协议(用于无盘设备启动)
- DNS: 域名解析协议
当然, 也包括你自己写UDP程序时自定义的应用层协议;