【JavaEE精炼宝库】网络原理基础——网络层

文章目录

一、IP 协议的格式
二、IP 地址的数量限制
三、私有 IP 地址和公网 IP 地址
- 3.1 私有 IP 地址和公网 IP 地址的基本知识：
- 3.2 内网 IP 设备访问外网 IP 设备的过程（NAT 机制）：
四、地址管理
- 4.1 网段划分：
- - 4.1.1 网段划分基本知识：
  - 4.1.2 CIDR | 子网掩码：
- 4.2 特殊的 IP 地址：
五、路由选择

网络层的作用主要有（1）路径规划（路由选择）。（2）地址管理。

在网络层中IP协议独自占了大壁江山。所以介绍网络层其实就是在介绍IP协议。

基本概念：

主机：配有 IP 地址，但是不进行路由控制的设备。
路由器：即配有 IP 地址，又能进行路由控制。
节点：主机和路由器的统称。

一、IP 协议的格式

下图为 IPv4 协议的格式。

4 位版本号（version）：指定 IP 协议的版本，对于 IPv4 来说，就是 4，对于 IPv6 来说，就是 6。

4 位首部长度（header length）：IP 头部的长度单位是 4 个字节，也就是length * 4 的字节数。4 bit 表示最大的数字是 15，因此 IP 头部最大长度是 60 字节，根据上图可知 IP 头部最短长度是 20 字节。

8 位服务类型（Type Of Service)：3 位优先权字段（已经弃用），4 位TOS字段，和 1 位保留字段（必须置为 0）。4 位TOS分别表示：最小延时，最大吞吐量，最高可靠性，最小成本。这四者相互冲突，只能选择一个。对于 ssh / telnet 这样的应用程序，最小延时比较重要，对于 ftp 这样的程序，最大吞吐量比较重要。

16 位总长度（total length）：IP 数据报整体占多少个字节。 总长度去掉 IP 首部长度，剩下的就是 TCP / UDP 数据包的总长度。如果是 TCP ，去掉 TCP 报头长度，剩下的就是载荷长度（TCP 报头中算不出载荷长度，所以要用这种方法）。

16 位标识（id）：唯一的标识主机发送的报文（用来区分哪些数据包要进行合并）。如果 IP 报文在数据链路层被分片了，那么每一个片里面的这个 id 都是相同的。

3 位标志：第一位保留（保留的意思是现在不用，但是还没想好，说不定以后要用到）。第二位置为 1 表示禁止分片，这时候如果报文长度超过 MTU，IP 模块就会丢弃报文。第三位表示"更多分片"，如果分片了的话，最后一个分片置为 1，其他是 0。类似于一个结束标记。

13 位片偏移（framegament offset）：是分片相对于原始 IP 报文开始处的偏移（确定若干个要拼接的数据包先后顺序）。其实就是在表示当前分片在原报文中处在哪个位置。实际偏移的字节数是这个值 * 8 得到的。因此，除了最后一个报文之外，其他报文的长度必须是 8 的整数倍（否则报文就不连续了）。

8 位生存时间（Time To Live，TTL)：数据报到达目的地的最大报文跳数。一般是 64。每次经过一个路由，TTL - 1，一直减到 0 还没到达，那么就丢弃了。这个字段主要是用来防止出现路由循环。

8 位协议：表示上层协议的类型（载荷部分是 TCP 还是 UDP 还是其他的协议）。

16 位首部校验和：使用 CRC 进行校验，来鉴别头部是否损坏。

32 位源 IP 地址和 32 位目的 IP 地址：表示发送端和接收端。为了让我们方便观察，把 32 位的整数通常表示成 “点分十进制”的方式。例如 192.168.2.103。

选项字段（不定长，最多 40 字节）：略。

IP 协议数据包的总长度是 64 KB，如果载荷太长，会导致 IP 协议数据包的总长度超过 64 KB，这时 IP 协议数据包会进行拆包发送，在接收端进行组包。 通过 16 位表示 + 3 位标志 + 13 位片偏移这三个属性，实现 IP 协议的拆包组包。

二、IP 地址的数量限制

IP 地址（IPv4）是一个 4 字节 32 位的正整数。那么一共只有 2 的 32 次方个 IP 地址，大概是 43亿左右。而 TCP/IP 协议规定，每个主机都需要有一个 IP 地址。这意味着，一共只有 43 亿台主机能接入网络么？实际上，由于一些特殊的 IP 地址的存在，数量远不足 43 亿。另外 IP 地址并非是按照主机台数来配置的，而是每一个网卡都需要配置一个或多个 IP 地址。

针对 IP 地址不够用，有三种方式来解决：

动态分配 IP 地址： 只给接入网络的设备分配 IP 地址。因此同一个 MAC 地址的设备，每次接入互联网中，得到的 IP 地址不一定是相同的。
NAT 技术： 把 IP 地址，分成两个大类：（1）私网 IP（局域网内部使用）。（2）公网 IP （广域网使用）。此时约定公网 IP 唯一，私网 IP 允许在不同的局域网中重复。虽然能上网的设备非常多，但是绝大部分都是在局域网中的。
采用 IPv6 协议： IPv6 并不是 IPv4 的简单升级版，这是互不相干的两个协议，彼此并不兼容。IPv6 用 16 字节 128 位来表示一个 IP 地址（数量非常大，足够给世界上每一粒沙子分配一个 IP 地址），但是目前 IPv6 还没有普及。

截至到 2023 年 8 月 28 日，我国 IPv6 活跃用户数达 7.67 亿（网民总数为 10.79 亿，占比 71%），世界领先。大力发展 IPv6 的原因，参考以下视频：电子监听、全国断网，棱镜门背后，中国如何从末路狂奔到世界之巅

三、私有 IP 地址和公网 IP 地址

3.1 私有 IP 地址和公网 IP 地址的基本知识：

注意：私有 IP 地址和私网 IP 地址是一个意思。

如果一个组织内部组建局域网，IP 地址只用于局域网内的通信，而不直接连到 Internet 上，理论上使用任意的 IP 地址都可以，但是 RFC 1918 规定了用于组建局域网的私有 IP 地址。

以下为私网 IP 的开头（*表示后续任意），这三个必须要记住。 除了这三个外，其他的基本都是公网 IP（特殊的后续有列出）

10.*
172.16 - 172.31.*
192.168.*

一个路由器可以配置两个 IP 地址，一个是WAN IP，一个是LANIP（子网 IP）。路由器LAN连接的主机，都从属于当前这个路由器的子网中。不同的路由器，子网 IP 其实都是一样的（通常192.168.1.1）。子网内的主机 IP 地址不能重复，但是子网之间的 IP
地址就可以重复了。每一个家用路由器，其实又作为运营商路由器的子网中的一个节点，这样的运营商路由器可能会有很多级，最外层的运营商路由器，WAN IP 就是一个公网 IP 了。子网内的主机需要和外网进行通信时，路由器将 IP 首部中的 IP 地址进行替换（替换成WAN IP），这样逐级替换，最终数据包中的 IP 地址成为一个公网 IP。这种技术称为NAT(Network Address Translation，网络地址转换）。如果希望我们自己实现的服务器程序，能够在公网上被访问到，就需要把程序部署在一台具有外网 IP 的服务器上。这样的服务器可以在阿里云/腾讯云上进行购买。

这里涉及到一个核心问题：引入上述的公网私网 IP，如何进行通信呢？

大体分为 5 种情况：

同一个局域网内部，设备之间通信：可以通信。由于一个局域网内部的设备之间的 IP 是不能重复的，所以可以正常进行通信。
广域网设备和广域网设备之间的通信：可以通信。广域网中的设备 IP 本来就是唯一的，可以正常进行通信。
局域网 1 中的设备 A 尝试访问局域网 2 中的设备 B：这种情况不允许访问。
局域网中的设备主动访问广域网设备：可以通信。这个过程中，NAT 机制就开始发挥作用了。
广域网设备主动访问局域网设备：不允许访问。因为局域网设备 IP 地址不是唯一的。

总结：被动方的 IP 地址不是唯一的就不能进行通信。因此，如果需要进行上述的局域网设备和局域网设备之间的通信，需要搭配广域网中的服务器，进行数据转发。

3.2 内网 IP 设备访问外网 IP 设备的过程（NAT 机制）：

下面利用简化版的过程来进行讲解。主机（内网）-> 路由器-> 百度（外网）。

运营商路由器，可以把它当作一个 NAT 设备，它会对中间经过的数据包，进行网络地址的转化，当内网设备经过运营商路由器访问外网的时候，就会把 IP 数据包中的源 IP，替换成它自己的 IP，端口号也会变（图中没有变）。

到达百度服务器之后，百度就会看到有一个 IP 地址为 5.6.7.8，端口号为 1234 的设备给它发送了一个请求，百度服务器对于我的电脑真实的内网 IP 是一无所知的。

运营商路由器内部维护了一个“映射关系”，记录当前这个相应的请求是从哪个内网中的设备发送过来的。

以上就是内网 IP 设备访问外网 IP 设备的过程。如果有多个内网设备同时访问外网，这时运营商路由器给出的 IP 地址是相同的，端口号是不同的。可以利用端口号来进行区分。

四、地址管理

4.1 网段划分：

4.1.1 网段划分基本知识：

IP 地址分为两个部分，网络号和主机号。

网络号：保证相互连接的两个网段具有不同的标识。
主机号：同一网段内，主机之间具有相同的网络号，但是必须有不同的主机号。

子网其实就是把网络号相同的主机放到⼀起。

如果在子网中新增一台主机，则这台主机的网络号和这个子网的网络号一致，但是主机号必须不能和子网中的其他主机重复。

通过合理设置主机号和网络号，就可以保证在相互连接的网络中，每台主机的 IP 地址都不相同。那么问题来了，手动管理子网内的 IP，是一个相当麻烦的事情，该如何解决呢？

答：有一种技术叫做DHCP，能够自动的给子网内新增主机节点分配 IP 地址，避免了手动管理 IP 的不便。一般的路由器都带有DHCP功能。因此路由器也可以看做一个DHCP服务器。

过去曾经提出一种划分网络号和主机号的方案，把所有 IP 地址分为五类，如下图所示：

随着 Internet 的飞速发展，这种划分方案的局限性很快显现出来，大多数组织都申请 B 类网络地址，导致 B 类地址很快就分配完了，而 A 类却浪费了大量地址。例如，申请了一个 B 类地址，理论上一个子网内能允许6万5千多个主机。A类地址的子网内的主机数更多，然而实际网络架设中，不会存在一个子网内有这么多的情况。因此大量的 IP 地址都被浪费掉了。

4.1.2 CIDR | 子网掩码：

针对上面这种情况提出了新的划分方案，称为CIDR(Classless Interdomain Routing)：引入一个额外的子网掩码（subnet mask）来区分网络号和主机号。子网掩码也是一个 32 位的正整数。通常用一串0来结尾。将 IP 地址和子网掩码进行按位与操作，得到的结果就是网络号。网络号和主机号的划分与这个 IP 地址是 A 类、B 类还是 C 类无关。

子网掩码：32 位整数。左半部分都是 1（网络号），右半部分都是 0（主机号），不会 01 交替出现。

将 IP 地址和子网掩码进行按位与操作，得到的结果就是网络号。255 说明 8 位都是 1，子网地址范围是网络号 +
主机号（最大和最小对应子网地址的范围）。

240 用 2 进制表示为 11110000，68 用 2 进制表示为 01000100。按位与就是 64，当 0100（网络号）0100（主机号），主机号最大和最小时就是子网地址范围。

可见，IP 地址与子网掩码做与运算可以得到网络号，主机号从全 0 到全 1 就是子网的地址范围。

IP 地址和子网掩码还有一种更简洁的表示方法，例如140.252.20.68/24，表示 IP 地址为140.252.20.68，子网掩码的高 24 位是1，也就是255.255.255.0。

4.2 特殊的 IP 地址：

将 IP 地址中的主机地址全部设为 0，就成为了网络号，代表这个局域网（这样的 IP 表示网段，不应该分配给具体的主机）。
将 IP 地址中的主机地址全部设为 1，就成为了广播地址，用于给同一个链路中相互连接的所有主机发送数据包（TCP 不支持广播，UDP 支持）。
127.*的 IP 地址用于本机环回（loop back）测试，通常是127.0.0.1。

五、路由选择

在复杂的网络结构中，找出一条通往终点的路线。路由的过程，是一跳一跳（Hop by Hop）"问路"的过程。所谓"一跳"就是数据链路层中的一个区间。具体在以太网中，指从源 MAC 地址到目的 MAC 地址之间的帧传输区间。

IP 数据包的传输过程也和问路一样：当 IP 数据包，到达路由器时，路由器会先查看目的 IP。路由器决定这个数据包是能直接发送给目标主机，还是需要发送给下一个路由器。依次反复，一直到达目标 IP 地址。

那么如何判定当前这个数据包该发送到哪里呢？

答：这个就依靠每个节点内部维护一个路由表。

路由表可以使用 route 命令查看。如果目的 IP 命中了路由表，就直接转发即可。路由表中的最后一行，主要由下一跳地址和发送接口两部分组成，当目的地址与路由表中其它行都不匹配时，就按缺省路由条目规定的接口发送到下一跳地址。

假设某主机上的网络接口配置和路由表如下：

这台主机有两个网络接口，一个网络接口连到192.168.10.0/24网络，另一个网络接口，连到 192.168.56.0/24网络。路由表的 Destination 是目的网络地址，Genmask 是子网掩码，Gateway 是下一跳地址，Iface 是发送接口，Flags 中的 U 标志表示此条目有效（可以禁用某些条目），G 标志表示此条目的下一跳地址是某个路由器的地址，没有 G 标志的条目表，表示的网络地址是与本机接口直接相连的网络，不必经路由器转。

转发过程例1：如果要发送的数据包的目的地址是192.168.56.3。跟第一行的子网掩码做按位与运算得到192.168.56.0，与第一行的目的网络地址不符，再跟第二行的子网掩码做按位与运算得到192.168.56.0，正是第二行的目的网络地址，因此从 eth1 接口发送出去。由于192.168.56.0/24 正是与 eth1 接口直接相连的网络，因此可以直接发到目的主机，不需要经路由器转发。
转发过程例2：如果要发送的数据包的目的地址是202.10.1.2。依次和路由表前几项进行对比，发现都不匹配，按缺省路由条目，从 eth0 接口发出去，发往192.168.10.1路由器，由192.168.10.1路由器根据它的路由表决定下一跳地址。