文章目录
- 1. 网络发展
- 2. 认识 "协议"
- 3. 网络协议初识
- 3.1 协议分层
- 4. OSI七层模型
- 4.1 TCP/IP五层(或四层)模型
- 5. 网络传输基本流程
- 5.1 同一个网段内的主机文件传输
- 5.2 认识MAC地址
- 5.3 跨网段的主机文件传输
- 6. 数据包封装和分用
1. 网络发展
很早之前,计算机之间相互独立,也就是独立模式。
这样的效率是非常低效,以及非常麻烦。也就出现了网络互联: 多台计算机连接在一起,完成数据共享。
那么它们是如何连接起来的呢?下面从计算机结构来理解计算机通过网络互联的可能性。
这是前面说过的冯冯诺依曼体系结构,我们从输入设备输入到存储器,然后CPU从存储器取数据进行运算,把结果再写到存储器中,再由输出设备输出。
那么这些硬件是如何进行数据交互的?
答案是:设备和设备间是有"线"连接起来的。
其实多主机连接,本质上其实也是通过"线"连接起来的。它们通过输出设备(网卡)相连。一台机器,线比较短,但多台机器想要互联,它们的线就比较长。其实计算机体系结构本质也可以被看作一个小型网络。
主机内,"线"比较短,会造成信号干扰。跨主机,"线"比较长,但会造成可靠性降低(丢失数据),效率降低,如何找到对方一些问题。然后我们需要根据这些问题去学习网络。
局域网LAN: 计算机数量更多了, 通过交换机和路由器连接在一起。
广域网WAN: 将远隔千里的计算机都连在一起。
2. 认识 “协议”
“协议” 是一种约定,计算机之间的传输媒介是光信号和电信号。通过 “频率” 和 “强弱” 来表示 0 和 1 这样的信息。要想传递各种不同的信息, 就需要约定好双方的数据格式。
通信的两台主机,约定好协议就可以了么?
计算机生产厂商有很多,计算机操作系统也有很多,计算机网络硬件设备还是有很多,这些也需要约定好协议。如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来约定一个共同的标准。这就是网络协议。
3. 网络协议初识
3.1 协议分层
首先,我们要知道软件也是可以分层的,比如说我们以前写代码都写在main函数里,后面我们可以把部分功能可以写到函数里面。这叫做软件分层。
软件分层的优点:
1.软件在分层的同时,也把问题归类了,方便查出问题所在。
2.分层的本质在软件上解耦。
3.便于进行软件维护。
而网络本身的代码,就是层状结构。
举个例子:
在这个例子中,我们的协议只有两层。但是实际的网络通信会更加复杂,需要分更多的层次。
层状结构下的网络协议,我们认为同层协议都可以认为自己在和对方直接通信,忽略底层细节。所以,同层之间一定要有自己的协议。
4. OSI七层模型
OSI(开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范。把网络从逻辑上分为了7层。每一层都有相对应的物理设备。OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输。但是,它既复杂又不实用,并且在真正去实现的时候,会话层和表示层是根据情况来实现的,所以我们按照TCP/IP五(或四)层模型来讲解。
4.1 TCP/IP五层(或四层)模型
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇。
TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求。
物理层:负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤, 现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等. 集线器工作在物理层。
数据链路层:负责设备之间的数据帧的传送和识别。例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作。有以太网、令牌环网, 无线LAN等标准. 交换机工作在数据链路层。
网络层:负责地址管理和路由选择。例如在IP协议中, 通过IP地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由)。路由器工作在网路层。
传输层:负责两台主机之间的数据传输。如传输控制协议 (TCP),能够确保数据可靠的从源主机发送到目标主机。
应用层:负责应用程序间沟通,如简单电子邮件传输、文件传输协议、网络远程访问协议等。我们的网络编程主要就是针对应用层。
物理层我们考虑的比较少,因此很多时候也可以称为 TCP/IP四层模型。
一般而言,对于一台主机,它的操作系统内核实现了从传输层到物理层的内容。
5. 网络传输基本流程
5.1 同一个网段内的主机文件传输
首先,我们介绍一下网络和操作系统的关系:
物理层对应的就是硬件,数据链路层对应的就是驱动程序,网络层和传输层对应的就是操作系统,而系统调用上面的就是应用层,像一些lib库,shell外壳,指令就是应用层。而应用层上面就是我们的用户。
结论:网络协议栈是隶属于OS的,操作系统内部,有一个模块就叫做tcp/ip协议。
那么两个主机间传输数据的过程是什么样的呢?
如下图所示:
用户从应用层发送信息,到物理层,再从另外一个物理层到应用层到我们的用户。
体系结构直接决定,数据包在主机内进行流动的时候,一定是要进行自顶向下或者自底向上进行流动的。
下面重新认识一下协议,在计算机视角,是如何看待协议的呢?
主要体现在代码逻辑上和数据上。
假如我们买了一个鼠标,实际上快递员给你的是一个包裹,里面有鼠标。原因在包裹上有一个快递单,这个快递单就是一份数据,用来作为快递公司和快递点,快递小哥之间的协议。所以,为了维护协议,一定要在被传输的数据上,新增其它数据(协议数据)。
什么意思呢?我们来看下面的流程图:
假设主机A的用户发了一条消息叫你好,根据体系结构决定,数据包在主机内进行流动的时候,要自顶向下进行流动。在经过应用层的时候,会添加一份应用层的协议数据。
应用层会通过接口把数据传给传输层。
也是如此,传输层也会添加自己的协议数据。
每一层都是如此,物理层是硬件,不需要添加协议数据。然后由主机A的物理层传输给主机B的物理层。
然后主机B根据体系结构,数据包在主机内进行流动的时候,要自底向上进行流动。在链路层的时候,会把和它相关的协议数据取下,拿出它的消息。
在网络层,传输层,应用层也是同样的道理,把对应的协议数据取下,拿出对应的消息。
那么主机A的过程叫做数据的封装,主机B的过程叫做数据的解包。
我们把每一层的数据交付给下一层的时候,给它添加本层的"协议数据",也被叫做报头。拼接在原始数据的开头。
如果两台主机,处于同一个局域网,这两台主机,能够直接通信吗?
答案是:可以的。这个局域网也叫做以太网,是一种局域网标准。
局域网通信的原理:
每一台主机都要有唯一的标识,也就是该主机对应的MAC地址,实际上这个MAC地址就是我们网卡地址。主要作用在局域网。
任何一台主机,在任何时刻,都可以随时发消息。这叫做碰撞域。这样就会无法准确的收到对应的消息,但是可以识别碰撞(碰撞检测),然后执行碰撞避免,最后再发消息。
以太网站在系统角度,它就是一种临界资源。
5.2 认识MAC地址
那么我们如何查看Linux下的MAC地址呢?
黄色框的就叫做MAC地址,长度为48位,及6个字节。一般用16进制数字加上冒号的形式来表示。
MAC地址用来识别数据链路层中相连的节点,在网卡出厂时就确定了,不能修改。 mac地址通常是唯一的(虚拟机中的mac地址不是真实的mac地址,可能会冲突; 也有些网卡支持用户配置mac地址)。
5.3 跨网段的主机文件传输
上面说的是同一个网段内的两台主机进行文件传输,我们再说一下:跨网段的主机的文件传输,数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器。
两个局域网通过路由器来连接起来。它至少要有2个网络接口,甚至2张网卡,我们从一方发送给另外一方时,必须通过路由器。
流程图如下:
我们把信息发送到路由器,此时需要引入一个IP地址。它和MAC的区别是什么呢?
举个例子:如果我们想从北京到南京,中间要在西安转站。我们会说从北京来,到南京去。还有一种说法:上一站从北京来,下一站去西安,或者上一站从西安来,下一站去南京。
第一种说法,是最开始的起始地和最终目的地,对应的就是IP地址。起始地就是源IP,目的地就是目的IP。
第二种说法,对应的MAC地址,也就是源MAC地址和目标MAC地址。
MAC地址,用在局域网中,标识主机的唯一性。
IP地址,用在广域网(公网)中,标识主机的唯一性。
当我们从以太网发送到路由器时,会解包。然后再发送到令牌环。
发送到令牌环时会重新添加新的报头。
后面的过程都是一样的了。从这我们也可以看出:所有的IP向上的协议,发送和接受主机看到的数据是一模一样的。它屏蔽了底层网络的差异。
6. 数据包封装和分用
现在有一个数据帧向上传输的时候,其实每一层都有许多协议,那么它怎么知道去掉的是IP的报头,而不是arp/rarp的报头呢?
数据包添加报头的时候,也要考虑未来解包的时候,将自己的有效载荷交付给上层的哪一个协议。这个过程叫做有效载荷分用的过程。
一般而言,任何报头属性里面,一定要存在的一些字段能支持我们进行封装和解包,并且也要支持分用。
不同的协议层对数据包有不同的称谓,在传输层叫做段,在网络层叫做数据报,在链路层叫做帧。
应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部,称为封装。
首部信息中包含了一些类似于首部有多长,载荷有多长, 上层协议是什么等信息。