一、什么是协议

为了使数据在网络上传输（从源头到达目的），网络通信的参与方必须遵循相同的规则，如：怎么样建立连接、怎么样传输、怎么样互相解析信息等。只有遵守这个约定，计算机之间才能相互通信交流。这样的规则就被称之为协议（protocol），它最终体现为在网络上传输的数据包的格式。

协议约定了层级和层级之间的调用关系，上层协议调用下层协议，下层协议给上层协议提供支持，不能跨层调用。

详细内容查看：程序猿眼中的协议：TCP / IP 五层网络模型_保护小周ღ的博客-CSDN博客

真实的网络协议使用的是 TCP / IP 五层网络模型，也是当下最广泛使用的网络的模型。

本次讲述的 UDP 协议是传输层上比较常用的协议。

另外一个更厉害的协议 TCP 敬请期待下一篇博客~

二、认识UDP 协议

UDP（User Datagram Protocol）是一种无连接的传输层协议，它不保证数据传输的可靠性，但是具有传输速度快、开销小等特点。UDP协议主要用于需要快速传输数据且对数据的可靠性要求不高的场景，如在线游戏，分布式系统信息的传输（短距离的传输 UDP 的传输的效率是很高的）。

2.1 UDP协议的特点：

无连接：UDP协议在传输数据之前不需要建立连接，也不需要维护连接状态，可以看作是一股脑地传输，因此传输速度快。
不可靠：UDP协议不保证数据传输的可靠性，因为它不提供重传机制、异常处理等功能，如果数据在传输过程中出现丢失或错误，UDP协议也不会进行任何处理。
面向数据报：数据报是通过网络传输的数据的基本单元，包含一个报头（header）和数据本身，其中报头描述了数据的目的地以及和 “荷载” 数据之间的关系。UDP协议的头部只有8个字节，相比TCP协议的头部要小得多，开销也相对小。该知识点下文详细介绍。
全双工通信：通信允许数据在两个方向上同时传输，比如打电话，通话双方可以同时讲话。
支持广播和多播：UDP协议支持广播和多播，可以将数据同时发送给多个主机。

敲黑板面试题：TCP 与 UDP有什么区别？

TCP 是面向有连接，采用字节流传输，数据传输可靠的全双工通信协议。

UDP 是面向无连接，采用数据报传输，数据传输不可靠的全双工通信协议。

2.2 UDP 协议的报文格式

学习协议其中一个重要的环节就是认识协议报文格式，一个协议具体是怎么组织数据的。

编辑

UDP报文主体分为两个部分: UDP报头(占8个字节的数据) + UDP数据 / UDP载荷

荷载:比较容易理解,里面存储的是应用层的数据报。
UDP报头：源端口，目的端口，报文长度，校验和，组成，每个部分占两个字节，可以描述的数据范围是 [0, 65535] 。

解析报文：

源端口:表示数据从哪里来，端口号可认为是一个进程的标识（那个软件发送的信息），传输层毕竟给应用层提供服务。
目的端口:表示数据到哪里去，数据报到达指定主机后，将数据报给那个软件解析（进程，通信双方约定了统一的协议格式就可以互相解析数据）。
传输层的数据报进入网络层后会添加网络层报头，网络层报头中会描述源 IP 和目的IP ,这层协议可以用来在庞大的网络环境中找到目标主机。
报文长度：描述了一条 UDP 数据报所占字节大小，因为长度只占 2个字节，所以他能描述的数据范围是 [0, 65535], 所以一条 UDP 数据报最大长度是 65536 个字节 = 64KB；
校验和：网络传输并非完全稳定，信息的传输方式有多种多样，难免会出现意外，例如说：恶劣天气，强磁场干扰，传输介质，信号衰减等原因，所以校验和存在的目的就是用来判断一下，当前传输的数据是否出错，如果校验和不对，传输的数据一定不对，即使校验和是对的，数据也有一定的概率是错误的，校验和的校验方式通常会以数据内容（正文荷载中的数据）作为参数进行算法计算，当接收方拿到 UDP 数据报后, 把荷载中的数据拿出来代入校验和算法，再把结果与校验和比较是否相同，即可判断数据传输是否准确。（前提是输入的内容一样，按照统一算法得到的校验和结果也是一样的）。只能由接收端判断数据是否可靠，UDP 协议不提供重发机制，错了就错了，只管传输。
UDP 数据报正文\荷载：里面包含的是应用层数据报的信息，UDP 报文长度（最大值） - UDP 报头即可得荷载大小，报文长度最大是可以描述 64字节，UDP整个报头占 8 个字节，所以荷载最大存储空间（一条UDP 数据报最大能携带的应用层信息）是 64 - 8 = 56字节。

端口号详解：

所谓的端口，可以看作应用程序的门牌号一样，客户端可以通过ip地址找到对应的目的端，但是目的端是有很多应用程序端口的，每个应用程序对应一个端口号；

比如说我电脑qq 给你发了一条消息，这个条消息通过网络发送到你的电脑，进入你的电脑后，这条消息怎么能知道要给那个应用程序呢（进程）？微信也是腾讯的，也没见着能接收qq 发的消息啊，关键的就是应用程序在启动时会绑定了一个端口号（端口号在一定范围内可以随机使用），一台主机中的端口号不可重复，所以消息在进入主机后就会根据端口号将信息发送到指定应用程序，应用程序就根据应用层的数据报协议（这个可以是通信双方约定的协议，qq自己的协议）解析信息。

端口号只占两个字节，可以描述的数据范围是 [0, 65535] ，也就是我们可以使用的端口号只有这么多，对于小于 1024 的端口号被称之为“知名端口号”，是提供给一些名气比较大的服务器使用，例如：http 服务器的端口号位 80， ssh 的端口号为：22， ftp 服务器的端口号是 21。所以我们要在程序设计中尽量避免使用这部分端口。

2.3 使用UDP 协议传输大文件时的策略

上文介绍一条 UDP 数据报最大可以传输 64 个字节，去掉报头之后有效的报文荷载只有56字节，也就是说一条 UDP 数据最多传输 56个字节的内容，对于高速发展的科技，太小了，一首歌就有几兆呢（M）。

在面对大型文件传输的时候，UDP 将一个大的数据报拆分成多个部分，使用多个 udp 数据报来传输，作为接收方（应用层）来讲，就需要与发送方（应用层）约定好数据报的解析协议。

例如：我qq给女朋友发送了一大段小作文(应用层的数据报)，刷刷的好几百KB, 使用 UDP 协议传输，一条UDP 数据报肯定是不够的，就可以分割成好几条数据报传输，作为接收方（女朋友）的qq, 就需要将发送过来的 UDP 数据报解析\分用成应用层数据报，这个时候根据某种相互约定好的协议才能解析。

编辑

作为接收方来讲以上数据如何由多条UDP 数据报，组合成一条应用层的数据报呢？

所谓封装 UDP 数据报，分割应用层数据报什么的实质上就是字符串的拼接，也就是说数据报的本质就是字符串，协议就是描述了如何封装\分用\解析这些字符串。

UDP协议并没有对分割后的数据报作出重新组合的规定，这是由应用层协议负责实现（因为是应用层选择使用 UDP 协议），那么就需要根据UDP协议长度这一特性来设计应用层数据报，一般来说，应用层协议会在发送端进行相关处理，将原始数据分割成多个UDP数据报发送出去，在接收端进行接收之后再进行重新组合，实现方法可以有多种，比如可以在UDP首部附加序列号等信息，接收端通过这些信息来拼接数据报，包括使用一些特殊的分隔符区分一条应用层数据报等等，这方面都是可以通过应用层的手段来控制的。

使用一些特殊的分隔符区举个例子：