文章目录
- 计算机网络发展过程
- 独立模式
- 网络互联
- 局域网LAN
- 广域网WAN
- 计算机网络协议的概念
- 网络协议
- 协议分层
- OSI七层模型
- TCP/IP五层(或四层)模型
- 网络传输基本流程
- 数据包封装和分用
- 各层间通信
- IP地址
- MAC地址
- 端口
计算机网络发展过程
独立模式
计算机之间相互独立;
网络互联
多台计算机连接在一起, 完成数据共享;
局域网LAN
计算机数量更多了, 通过交换机和路由器连接在一起;
广域网WAN
将远隔千里的计算机都连在一起; 所谓 "局域网"和"广域网"只是一个相对的概念。广域网,也可以看做一个比较大的局域网。
计算机网络协议的概念
协议是双方约定同一种语言,进行沟通,计算机之间的传输媒介是光信号和电信号. 通过 “频率” 和 “强弱” 来表示 0 和 1 这样的信息. 要想传递各种不同的信息, 就需要约定好双方的数据格式。
网络协议
计算机生产厂商有很多;计算机操作系统, 也有很多;计算机网络硬件设备, 还是有很多;如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来, 约定一个共同的标准,大家都来遵守, 这就是网络协议; 网络协议是通信双方,约定通信时使用的数据格式,进行网络通信。
协议分层
操作系统要进行协议管理,对协议进行管理也是先描述再组织。协议本质就是软件,软件是可以“分层”的,所以协议在设计的时候就是按照层状划分的。网络协议划分成层状结构是为了面对复杂场景,对功能进行解耦,便于进行维护。
在这个例子中, 协议只有两层; 但是实际的网络通信会更加复杂(通信的复杂本质上和距离成正相关), 需要分更多的层次.分层最大的好处在于 “封装” 。
OSI七层模型
- OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范。
- 把网络从逻辑上分为了7层. 每一层都有相关、相对应的物理设备,比如路由器,交换机。
- OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输。
- 它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯。
- 它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯。
- 应用层:为应用程序提供交互服务。在互联网中的应用层协议很多,如域名系统DNS、HTTP协议、SMTP协议等。
- 表示层:负责数据格式的转换,如加密解密、压缩解压缩等。
- 会话层:负责在网络中的两节点之间建立、维持和终止通信,如服务器验证用户登录便是由会话层完成的
- 运输层:负责向两台主机进程之间的通信提供数据传输服务。传输层的协议主要有传输控制协议TCP和用户数据协议UDP。
- 网络层:选择合适的路由和交换结点,确保数据及时传送。主要包括IP协议。
- 数据链路层:将网络层传下来的IP数据包组装成帧,并再相邻节点的链路上传送帧。
- 物理层:实现相邻节点间比特流的透明传输,尽可能屏蔽传输介质和通信手段的差异。
OSI是指定的一种标准,理论设计和工程实践有差别,实际操作中TCP/IP协议考虑应用层场景复杂的情况,将应用层、表示层、会话层统一定制为应用层。
TCP/IP五层(或四层)模型
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇。TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求。物理层我们考虑的比较少,因此很多时候也可以称为 TCP/IP四层模型。
- 物理层: 负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞 线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤, 现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等. 集线器(Hub)工作在物理层.
- 数据链路层: 负责设备之间的数据帧的传送和识别. 例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作. 有以太网、令牌环网, 无线LAN等标准. 交换机(Switch)工作在数据链路层.
- 网络层: 负责地址管理和路由选择. 例如在IP协议中, 通过IP地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由). 路由器(Router)工作在网路层。
- 传输层: 负责两台主机之间的数据传输. 如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机。
- 应用层: 负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等. 我们的网络编程主要就是针对应用层。
网络传输基本流程
同一个网段内的两台主机进行文件传输 ,两台计算机通过TCP/IP协议通信的过程如下所示:
网络数据的转发需要先经历自己的网络协议栈,进而通过网络将数据转化为光电信号,传输到对端机器,对端机器收到数据之后,需要经历自己的机器网络协议栈的层层向上提交,一直将数据提交到应用层的应用程序当中。
跨网段的主机的文件传输,数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器 ,这种设计保证了在使用TCP/IP协议的网络中,IP以及向上的协议所能看到的报文都是一样。
数据包封装和分用
数据包 = 报头 + 报文/有效载荷,每层协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报 (datagram),在链路层叫做帧(frame) ,应用层数据通过协议栈发到网络上时,经过每层协议的时候都要加上一个数据首部(header) /报头 ,称为封装,封装的本质就是添加报头,分用/解包的本质就是去掉抱头并展开分析,将本层的有效载荷交付给上层协议。。首部信息中包含了一些类似于首部有多长, 载荷(payload)有多长, 上层协议是什么等信息 。数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部, 根据首部中的 “上层协议字段” 将数据交给对应的上层协议处理。
数据包的封装,就是每一层在传输给下一层数据/有效载荷的时候,会在数据前加上该层特有的报头。数据包的分用就是被封装完毕后的数据经管网络传给接受方时,接受方进行封装的逆过程,提取有效载荷。每一个协议都要考虑如何封装报文,如何解包,以及将有效载荷交付给上层哪一个协议的问题。
各层间通信
发送方与接收方各层之间必须采用相同的协议才能建立连接,实现正常的通信。应用层之间必须采用相同的编码解码规则,才能保证用户信息传输的正确性。传输层之间必须采用相同的端口号与协议关系,才能保证上层应用进程间的通信。网络层之间必须采用相同的逻辑寻址过程才能保证数据不会传输到错误的目的地。数据链路层之间如果协议不同,接收方无法“理解”数据的内容。物理层之间必须硬件接口规格相同,否则接收不到信号。
在实际的网络环境中,发送方和接受方之间会有很多的硬件设备起到中转的作用。从发送主机物理网卡发出的电信号通过网线到达交换机,交换机将电信号转换成二进制数据送往交换机的数据链路层。交换机根据数据帧头部的MAC地址将数据智能转发到对应的路由器设备,在转发前要重新将二进制数据转换成物理的电信号。路由器接受到数据后,会拆掉数据链路层的MAC头部信息,将数据包送往网络层,路由器将检测数据包头部的目标IP地址信息,并根据该信息进行路由转发,将数据报文转发到下一路由器上,在转发前要重新封装新的MAC头部信息,并将数据转换成二进制。之后的过程与前面大同小异。简单来说就是路由器接受电信号,将电信号转换成二进制数据发往网络层,然后根据MAC地址和IP地址进行重新封装转换为电信号进行转发,然后对应的交换机接受电信号,然后根据MAC地址传送到接收主机的网卡中。
IP地址
IP协议有两个版本, IPv4和IPv6. 没有特殊说明的, 默认都是指IPv4。IP地址是在IP协议中, 用来标识网络中不同主机的地址; 对于IPv4来说, IP地址是一个4字节, 32位的整数,通常也使用 “点分十进制” 的字符串表示IP地址, 例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是0~255。IP地址的作用:可以在网络当中唯一标识一台主机,一个公网IP地址只能被一台机器所占有,一个机器可以拥有多个IP地址。
MAC地址
MAC地址用来识别数据链路层中相连的节点,在一个局域网中,MAC地址实现从一个主机标定另外一个主机的功能。长度为48位/6个字节. 一般用16进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)。 MAC地址在网卡出厂时就确定了, 不能修改 。mac地址通常是唯一的 (但是虚拟机中的mac地址不是真实的mac地址, 可能会冲突; 也有些网卡支持用户配置mac地址) 。
端口
端口号(Port)标识了一个主机上进行通信的不同的应用程序。在TCP/IP协议中, 用 “源IP”, “源端口号”, “目的IP”, “目的端口号”, “协议号” 这样一个五元组来标识一个通信。
端口号范围划分
- 0 - 1023: 知名端口号, HTTP, FTP, SSH等这些广为使用的应用层协议, 他们的端口号都是固定的。
- 1024 - 65535: 操作系统动态分配的端口号. 客户端程序的端口号, 就是由操作系统从这个范围分配的。
知名端口号
有些服务器是非常常用的, 为了使用方便, 人们约定一些常用的服务器, 都是用以下这些固定的端口号:
- ssh服务器, 使用22端口
- ftp服务器, 使用21端口
- telnet服务器, 使用23端口
- http服务器, 使用80端口
- https服务器, 使用443
执行下面的命令, 可以看到知名端口号,我们自己写一个程序使用端口号时, 要避开这些知名端口号。执行下面的命令, 可以看到知名端口号。
cat /etc/services
进程和端口号
一个进程可以bind多个端口号,一个端口号不可以被多个进程bind。
netstat查看网络状态
可以使用 netstat [选项] 命令来查看网络状态。
常用选项如下:
- n 拒绝显示别名,能显示数字的全部转化成数字。
- l 仅列出有在 Listen (监听) 的服務状态。
- p 显示建立相关链接的程序名。
- a (all)显示所有选项,默认不显示LISTEN相关。
- u (udp)仅显示udp相关选项。
- t (tcp)仅显示tcp相关选项。