计算机中的常见概念
- 协议(Protocol):
-
- 协议是计算机网络中用于通信的规则和约定的集合。它规定了数据传输的格式、序列、错误检测和纠正方法等。常见的网络协议包括TCP/IP、HTTP、FTP等。
- IP地址(IP Address):
-
- IP地址是用于唯一标识网络中设备的32位或128位数字。IPv4和IPv6是两种常见的IP地址版本。IP地址用于数据在网络中的寻址和路由。
- 子网掩码(Subnet Mask):
-
- 子网掩码是一种用于将IP地址划分为网络和主机部分的技术。它帮助确定哪些位用于网络标识,哪些位用于主机标识。
- 路由器(Router):
-
- 路由器是用于在不同网络之间转发数据包的设备。它基于目标IP地址决定最佳路径,实现网络之间的连接。
- 交换机(Switch):
-
- 交换机是用于在同一网络中转发数据包的设备。它基于MAC地址决定数据包的目标位置,提高网络内部的传输效率。
- 协议栈(Protocol Stack):
-
- 协议栈是一组按照特定顺序组织的网络协议,通常按照OSI模型或TCP/IP模型进行层次化排列。每个层次负责不同的功能,如物理传输、数据链路、网络、传输、会话、表示和应用。
- DNS(Domain Name System):
-
- DNS用于将易记的域名映射到对应的IP地址。通过DNS,用户可以使用主机名而不是IP地址来访问网络资源。
- HTTP(Hypertext Transfer Protocol):
-
- HTTP是用于在Web上传输超文本的协议。它定义了客户端和服务器之间的通信规则,支持网页的浏览和检索。
- Firewall(防火墙):
-
- 防火墙是一种用于保护网络安全的设备,它可以监控、过滤和控制网络流量。防火墙可以阻止未经授权的访问和恶意活动。
- VPN(Virtual Private Network):
-
- VPN是一种通过公共网络建立安全连接的技术。它用于在不安全的网络上创建加密通道,使用户可以安全地访问私有网络资源。
- LAN(Local Area Network)和WAN(Wide Area Network):
-
- LAN是指局域网,它覆盖较小的地理区域,如办公室或校园。WAN是指广域网,它覆盖更大的地理区域,如城市、国家或全球。
- MAC地址(Media Access Control Address):
-
- MAC地址是一个唯一标识网络设备的地址,通常是48位的十六进制数。它用于在局域网中唯一标识设备。
认识协议
在以前,打电话不要钱,接通电话是要收费的,A去外省上大学去了,为了省电电话费,A跟他爸说,每周一我给你打一个电话,你不用接,一个电话代表一切平安;若我打了两个电话就是缺钱了,您给我打点生活费。这就是A和A父亲之间的一个协议。通过双方提前约定好的信息,来完成这次双方之间的通信。
协议是一种约定,
计算机之间的传输媒介是光信号和电信号,通过频率和强弱来表示0和1这样的信息。要想传递各种不同的信息,就需要约定号双方的数据格式。
相互通信的两台主机,约定好协议就可以了吗?
1. 如何保证传送的数据能准确的到达另一个设备。
2. 数据再转发的时候,如何定位主机。
3. 长距离传输中,数据安全的问题。
4. 如何处理发来的数据。
这四个问题要各自能解决自己的问题,也就是每一层都要有自己的协议。
1. 如何保证传送的数据能准确的到达另一个设备。(https http ftp等协议)
2. 数据再转发的时候,如何定位主机。(IP协议)
3. 长距离传输中,数据安全的问题。(tcp协议)
4. 如何处理发来的数据。(数据链路层)
要知道计算机生产厂商有很多;计算机操作系统, 也有很多;计算机网络硬件设备, 还是有很多;如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来, 约定一个共同的标准,大家都来遵守, 这就是 网络协议;
网络协议
协议分层
协议定义出来,就是要解决问题的,我们的问题是层状的,所以定义出来的协议也是层状的。网络通信很复杂,需要分的层次也很多。分层最大的好处在于 封装。
OSI七层模型
OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范;
把网络从逻辑上分为了7层. 每一层都有相关、相对应的物理设备,比如路由器,交换机;
OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输;
它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯;但是, 它既复杂又不实用; 所以我们按照TCP/IP四层模型来讲解;
分层名称 | 功能 | |
7 | 应用层 | 针对特定应用的协议 |
6 | 表示层 | 设备固有数据格式和网络标准数据格式的转换 |
5 | 会话层 | 通信管理。负责建立和断开通信连接(数据流动的逻辑通路)。管理传输层以下的分层 |
4 | 传输层 | 管理两个节点之间的数据传输。负责可靠传输(确保数据呗可靠的传送到目标地址) |
3 | 网络层 | 地址管理与路由选择 |
2 | 数据链路层 | 互联设备之间传送和识别数据帧 |
1 | 物理层 | 以0和1代表电压的高低,灯光的闪灭。界定连接器和网线的规格。 |
TCP/IP五层(或四层)模型
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇.
TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求.
物理层: 负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞 线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤, 现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等. 集线器(Hub)工作在物理层.
数据链路层: 负责设备之间的数据帧的传送和识别. 例如网卡设备的驱动、帧同步(就是说从网线上检测
到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作. 有以太
网、令牌环网, 无线LAN等标准. 交换机(Switch)工作在数据链路层.
网络层: 负责地址管理和路由选择. 例如在IP协议中, 通过IP地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由). 路由器(Router)工作在网路层.
传输层: 负责两台主机之间的数据传输. 如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机.
应用层: 负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等. 我们的网络编程主要就是针对应用层
数据链路层是由软件驱动完成的,他的下层是物理层,硬件部分。而传输层和网络层是在Linux内实现的。这两个层就是操作系统的一部分。
一般而言
对于一台主机, 它的操作系统内核实现了从传输层到物理层的内容;
对于一台路由器, 它实现了从网络层到物理层;
对于一台交换机, 它实现了从数据链路层到物理层;
对于集线器, 它只实现了物理层;
但是并不绝对. 很多交换机也实现了网络层的转发; 很多路由器也实现了部分传输层的内容(比如端口转发);
网络传输基本流程
- 报头(Header): 报头是网络通信中数据包的元信息,用于描述数据包的控制信息、元数据和其他必要的信息。报头包含了一系列字段,这些字段提供了有关数据包的信息,如源地址、目标地址、协议版本、数据包长度等。报头的目的是为了确保数据包能够被正确路由和处理。
- 报文(Message): 报文是网络通信中的一组数据,它包含了要传输的实际信息。报文可以包括请求、响应、命令、数据等不同类型的信息,具体取决于通信的目的和协议。在某些情况下,报文可以包含报头和有效载荷两个部分。
- 有效载荷(Payload): 有效载荷是报文中实际传输的数据部分,它包含了用户或应用程序关心的信息。有效载荷不包括报头,它是报文的核心内容。在一些协议和通信场景中,有效载荷可能是加密的、压缩的或以其他方式处理过的原始数据。
网络协议栈的层状结构当中,每一层都有自己的协议。
用户发送了一个 你好 的消息,在应用层当中是有自己的报头的,将报头和消息进行一个拼接,这就形成了一个报文。
比如说新老版本的微信,在市场上会存在有的人用老版本微信用户和新版本微信用户。这个时候服务器就要能区分新老版本。这要求微信内部要定好协议,好进行区分。如果说 你好 这个消息是要发给用户的,在经过应用层后,就要继续往下传递,经过传输层,传输层用来传递信息,就必须保证信息的完整性,可以在报文的前面带上序号。这说明传输层也有自己的协议。
继续往下传递就到了网络层,此时另一台主机收到了我发送的 你好,但是另一台主机并不知道是谁发送的,所以可以在添加上一个报头,来表明谁是发送者,谁是接收者。
再往下传递就到了数据链路层,这里也要添加数据链路层对应的协议。
而整个从应用层到数据链路层从上往下的过程就是一个封装的过程,每经过一层就需要添加报头。
再往下其实是有一个网卡的,数据发送给别人的时候,一定是网卡先拿到数据。拿到数据之后在交给操作系统。为什么要交给内存当中? 冯诺依曼体系是这样规定的。然后从下到上,一层一层的开始解析,因为每一台主机每一层的协议都是一样的。解析报头,最后,A怎么发给B的,B怎么接收A的信息的。
通信的过程,本质就是不断的封装和解包的过程。
数据包封装和分用
不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报 (datagram),在链路层叫做帧(frame).
应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装
(Encapsulation).
首部信息中包含了一些类似于首部有多长, 载荷(payload)有多长, 上层协议是什么等信息.
数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部, 根据首部中的 "上层协议字段" 将数据交给对应的上层协议处理
扩展
- 几乎任何层的协议,都要提供一种能力,将报头和有效载荷分离的能力
- 几乎任何层的协议,都要在报头中提供,决定将自己的有效载荷交付给上层的哪一个协议的能力,这种能力是报文的分用能力。
以太网通信
每台主机在局域网上,都要有自己的唯一的一个标识。
比如说在大学上课的时候,老师有时候会点名看考勤,当点到张三的名字的时候,教师中所有人都听到老师喊张三名字了。但是只有张三回答了老师。其他同学为什么不站起来?因为老师是给张三发的信息。老师在点张三的名的时候,教师中的所有同学都收到了信息,其他同学收到信息之后,进行提取,将自己的名字和张三做对比,发现不是自己,然后将老师发送的报文全部丢弃了。张三对比完成之后,符合条件,张三就回答了老师。
这种通信方式就是局域网(以太网)通信原理
每一台主机都会有一个MAC地址。每一台主机都有自己的网卡,假设现在有H1...H10的十个主机,MAC地址分别为M1...M10。H1要和H10进行通信。这个过程会有一个数据帧,这个数据帧其他主机收到了吗?H1和H10发送信息,局域网中的所有主机都会收到这个报文。所有主机都会对这个数据帧进行解析。非H10的主机在进行MAC地址对比后如果不是则会丢弃,H10也会做同样的工作。不过H10发现信息就发给自己的,后面就是将信息继续向上传递,层层解析,完成通信。
如果H2在发送信息,H1也在发送信息,此时这个消息就可能会发生数据碰撞问题,一但出现这个问题,所有人的信息都会出现异常。
一旦发生了碰撞,每一台发送主机都要执行碰撞避免的算法。
如果局域网比较大,这个时候可以使用交换机这个设备,通过交换机在概率上可以降低数据碰撞的概率。它有一个核心工作:划分碰撞域。
数据跨网络传输
数据想要跨网络传输,必须有一个路由器设备。路由器左边是一个局域网,右边也是一个局域网。左右边的网络通过路由器进行连接。
如何知道主机要跨网络的交给另一台主机?通过IP地址。IP地址能够标识一台主机在全网的唯一性。
前面提到过MAC地址,它跟IP地址的区别是什么?
IP协议有两个版本, IPv4和IPv6.
IP地址是在IP协议中, 用来标识网络中不同主机的地址;
对于IPv4来说, IP地址是一个4字节, 32位的整数;
我们通常也使用 "点分十进制" 的字符串表示IP地址, 例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是 0 - 255;
- 层次不同:
-
- IP地址: 位于网络层(第三层)的地址。IP地址用于在网络上唯一标识设备,使其能够进行跨网络的通信。
- MAC地址: 位于数据链路层(第二层)的地址。MAC地址用于在同一局域网(LAN)上唯一标识设备,帮助在局域网内进行直接通信。
- 作用范围不同:
-
- IP地址: 用于在全球范围内唯一标识网络上的设备。IP地址允许设备通过路由器等网络设备进行跨网络通信。
- MAC地址: 用于在同一局域网内唯一标识设备。MAC地址只在局域网内部具有唯一性,帮助在局域网内直接通信和数据帧的传输。
- 地址结构不同:
-
- IP地址: 通常表示为IPv4(32位地址,如192.168.1.1)或IPv6(128位地址,如2001:0db8:85a3:0000:0000:8a2e:0370:7334)格式。
- MAC地址: 通常表示为48位的十六进制数,例如00:1A:2B:3C:4D:5E。
- 动态性不同:
-
- IP地址: 可以是静态的(手动配置)或动态的(通过DHCP等协议动态分配)。
- MAC地址: 通常是固定的,由设备制造商在生产过程中分配,很少会更改。
在A主机中发送 你好 信息,路由器会先接受到信息,因为A主机通过路由器 来实现跨越不同网络的通信。路由器根据自己的路由表,决定如何进一步转发数据包,确保它最终到达S主机。