💓博主CSDN主页:杭电码农-NEO💓
⏩专栏分类:Linux从入门到精通⏪
🚚代码仓库:NEO的学习日记🚚
🌹关注我🫵带你学更多操作系统知识
🔝🔝
Linux网络
- 1. 前言
- 2. IP协议报头格式
- 3. 分片操作
- 4. 网段划分
- 5. 子网掩码的工作原理
- 6. IP地址的数量限制
- 7. 私有IP和公有IP
- 8. 路由过程
- 9. 总结
1. 前言
首先要清楚一点:
IP协议提供了将数据从A主机送到B主机的能力
本章重点:
本篇文章着重讲解IP协议的的格式, 以及格式字段所对应的细节. 会讲解网段划分和IP地址的一些特性. 最后会讲解路由过程
2. IP协议报头格式
请看下图:
协议中的每一个字段都有用处,
先列举出它们的大致作用, 后面会一一讲解:
- 4位版本号(version): 指定IP协议的版本, 对于IPv4来说, 就是4.
- 4位头部长度(header length): IP头部的长度是多少个32bit, 也就是 length * 4 的字节数. 4bit表示最大的数字是15, 因此IP头部最大长度是60字节.
- 8位服务类型(Type Of Service): 3位优先权字段(已经弃用), 4位TOS字段, 和1位保留字段(必须置为0). 4位TOS分别表示: 最小延时, 最大吞吐量, 最高可靠性, 最小成本. 这四者相互冲突, 只能选择一个. 对于ssh/telnet这样的应用程序, 最小延时比较重要; 对于ftp这样的程序, 最大吞吐量比较重要.
- 16位总长度(total length): IP数据报整体占多少个字节.
- 16位标识(id): 唯一的标识主机发送的报文. 如果IP报文在数据链路层被分片了, 那么每一个片里面的这个id都是相同的.
- 3位标志字段: 第一位保留(保留的意思是现在不用, 但是还没想好说不定以后要用到). 第二位置为1表示禁止分片, 这时候如果报文长度超过MTU, IP模块就会丢弃报文. 第三位表示"更多分片", 如果分片了的话, 最后一个分片置为1, 其他是0. 类似于一个结束标记.
- 13位分片偏移(framegament offset): 是分片相对于原始IP报文开始处的偏移. 其实就是在表示当前分片在原报文中处在哪个位置. 实际偏移的字节数是这个值 * 8 得到的. 因此, 除了最后一个报文之外, 其他报文的长度必须是8的整数倍(否则报文就不连续了).
- 8位生存时间(Time To Live, TTL): 数据报到达目的地的最大报文跳数. 一般是64. 每次经过一个路由, TTL -= 1, 一直减到0还没到达, 那么就丢弃了. 这个字段主要是用来防止出现路由循环
- 8位协议: 表示上层协议的类型.TCP或UDP
- 16位头部校验和: 使用CRC进行校验, 来鉴别头部是否损坏.
- 32位源地址和32位目标地址: 表示发送端和接收端.
这里我们先关注4位版本, 现在用的比较多的是IPV4, 但我们国家的IPV6的专利很多, 所以国家也在推崇使用IPV6, 它们的区别后面会讲. 我们需要关注的重点是13位片偏移和16位标记
3. 分片操作
由于数据链路层的物理特性, 一般无法转发太大的数据,
数据链路层一次性可以转发到网络的报文大小的限制是: (1500字节,MTU)
. 所以在数据传到链路层前, 要进行分片操作. 注意, 分片操作是网络层干的事情, 同理, 将不同的分片进行组装成完整的报文也是在对端的网络层进行的.
16位标记位:
由于一个报文可能会被分片成为多份, 我们需要标识来自于同一报文的分片, 所以16位标记位中存储的字段相同, 代表它们来自同一个报文
13位片偏移:
在组装分片时, 需要知道这些分片在原先报文中的顺序, 才能组装成为一个完整并且正确的报文. 13位片偏移就标识了当前分片在原先报文中的偏移量!
除此之外, 三位标记位中可以查看这个报文是否被分片了. 请注意, 对于上层是TCP协议而言, 一个完整的报文代表的是上层传输层传给我的所有数据, 而不是应用层发给对端的所有数据. 比如说应用层想要给对方发送: abcdefg\123456这串信息, 但是在传输层, 一次性只发送了abcdefg字符串, 那么在网络层看来, abcdefg就是一个完整的报文. 而不是abcdefg/123456
4. 网段划分
IP地址分为两个部分, 网络号和主机号
- 网络号: 保证相互连接的两个网段具有不同的标识;
- 主机号: 同一网段内, 主机间有相同的网络号, 但有不同的主机号;
合理设置主机号和网络号, 可以保证在相互连接的网络中, 每台主机的IP地址都不同.
过去曾经提出一种划分网络号和主机号的方案,
把所有IP 地址分为五类, 如下图所示:
这样带来的问题是B类地址被大量申请, 而A类地址几乎没人用. 并且B类地址是有限的, 如果不加管控, 可用的地址就会被掌握在少数国家手中. 于是引入了子网掩码来区分主机号和网络号
5. 子网掩码的工作原理
- 子网掩码是一个32位的正整数. 通常用一串 “0” 来结尾;
- 将IP地址和子网掩码进行 “按位与” 操作, 得到的结果就是网络号;
- 网络号和主机号的划分与这个IP地址是A类、B类还是C类无关;
举两个例子:
可见,IP地址与子网掩码做与运算可以得到网络号, 主机号从全0到全1就是子网的地址范围; IP地址和子网掩码还有一种更简洁的表示方法,例如140.252.20.68/24,表示IP地址为140.252.20.68, 子网掩码的高24位是1,也就是255.255.255.0
特殊的IP地址:
- 将IP地址中的主机地址全部设为0, 就成为了网络号, 代表这个局域网;
- 将IP地址中的主机地址全部设为1, 就成为了广播地址, 用于给同一个链路中相互连接的所有主机发送数据包;
- 127.*的IP地址用于本机环回(loop back)测试,通常是127.0.0.1
6. IP地址的数量限制
我们知道, IP地址(IPv4)是一个4字节32位的正整数. 那么一共只有 2的32次方 个IP地址, 大概是43亿左右. 而TCP/IP协议规定, 每个主机都需要有一个IP地址.
这意味着, 一共只有43亿台主机能接入网络么?
实际上, 由于一些特殊的IP地址的存在, 数量远不足43亿; 另外IP地址并非是按照主机台数来配置的, 而是每一个网卡都需要配置一个或多个IP地址.
解决方案:
7. 私有IP和公有IP
如果一个组织内部组建局域网,IP地址只用于局域网内的通信,而不直接连到Internet上,理论上 使用任意的IP地址都可以,但是RFC 1918规定了用于组建局域网的私有IP地址
- 10.*,前8位是网络号,共16,777,216个地址
- 172.16.到172.31.,前12位是网络号,共1,048,576个地址
- 192.168.*,前16位是网络号,共65,536个地址
- 包含在这个范围中的, 都成为私有IP, 其余的则称为全局IP(或公网IP);
私有IP对应的IP的局部的,不会出现在公网中, 所以私有IP可以在不同子网中出现重复, 这一操作大大缓解了IP地址不足的困境. 当跨子网通信时(如跨省通信,跨国通信), 再使用公网IP即可. 路由器对外对内有两套地址. 对外: WAN口IP, 自己所在的上级子网给自己分配的IP. 对内: LAN口IP, 又称为局域网IP
路由器要做的事情:
- 将报文中的源IP替换为路由器的WAN口IP
- 每经过一个内网路由器都会做这个工作
- 源IP在不同内网,不同层级的网络节点中转发的技术, 被称为NAT技术
也就是说, 世界上的公网体系其实是由多个内网组成的
NAT IP转换过程
这其中的细节其实很多, 但作为后端开发的我来说, 了解到这种地步就差不多了.
8. 路由过程
路由过程就是从A主机到B主机需要走的路径
从成都出发时, 我怎么知道当前要路由到重庆?而不是路由到贵州? 其实路由器一般只做两件事: 1. 判断当前目的IP能不能直接到达, 不能直接达到就发送给下一个路由器. 2. 能直接达到就直接将数据发送给主机.那么如何判定当前这个数据包该发送到哪里呢? 这个就依靠每个节点内部维护一个路由表.
使用route指令可查看路由表
路由表会告知你下一站应该往哪儿走
9. 总结
关于IP地址相关的知识还有很多, 但是正所谓术业有专攻, 对于应届生来说, 了解这么多已经很不错了. 这其中还包含很多细节知识, 就不一一阐述了, 大家有兴趣可以下来自学