数据链路层,考虑的是两个节点之间的传输。这里面的典型协议也很多,最知名的就是“以太网”。我们本篇主要介绍的就是以太网协议。这个协议规定了数据链路层,也规定了物理层的内容。
目录
以太网帧格式
帧头
载荷
帧尾
DNS
从输入URL到网页呈现的过程
DNS解析
递归查询
递归与迭代相结合查询
1.主机向本地域名服务器的查询采用的是递归查询
2.本地域名服务器向根域名服务器的查询采用迭代查询
TCP三次握手连接
客户端发送HTTP请求
服务器处理HTTP请求
客户端页面渲染
断开TCP连接
以太网帧格式
在经历了上一层的IP报头的拼接后,在数据链路层就是拼接上以太网帧报头了。
以太网数据帧 = 帧头+载荷+帧尾
帧头
其中,帧头包括了目的mac地址、源mac地址和类型。
此处不是使用IP地址表示了,而是搞了一个mac地址,也就是物理地址。这个是和IP地址完全独立的。每一个网络设备出场的时候就会有一个物理地址,这个是出厂时就决定了的。
既然有了IP地址为啥还要有mac地址?其实是最开始开发的是时候研发网络层和数据链路层的时候两伙人分别研究的,所以各自的研发出了一套体系。最终让IP和mac互相配合。
IP地址用来描述整个传输过程中的起点和终点。mac地址用来描述相邻的两个节点的起点终点。
数据链路层考虑的就是两个相邻节点之间怎么走。例如现在要从北京走到上海。
在这之中,分为两次中转,每次的IP是不变的,但是mac地址一直在变。
也就是说,IP描述的始终是从哪来到哪去,而mac描述的是当前阶段的任务。
载荷
表示的是IP数据报。
帧尾
类型0800:代表这是一个普通的以太网数据帧,载荷部分就是一个完整的IP数据包。
类型0806:载荷部分是一个ARP报文。
类型8035:载荷部分是一个RARP报文。
后两个是数据链路层另外的协议:ARP协议。
DNS
DNS协议,是当前互联网的基石。
DNS就是域名解析系统。当我们输入一个网址www.baidu.com的是时候,我们需要访问的是百度的IP地址,但是由于IP地址不好记住,所以用一些简单的单词来构成字符串表示这个地址。既然如此,就需要能够把域名和IP地址给对应上。
最原始的做法,就是使用一个hosts文件来记录,建立了IP和域名的映射关系。
最开始,互联网上的服务器寥寥无几,此时每个用户动手维护自己的hosts文件就够了,但是随着互联网发展越来越迅速,网站越来越多,此时手工维护就已经不靠谱了。这个时候,出现了DNS服务器。
当我们访问某个域名的时候,就自动的请求一下DNS服务器,DNS服务器就自动帮我们查询,把得到的结果(IP地址)返回给我们。如果电脑的DNS服务器配置的不对,或者DNS服务器挂了,就可能会出现一个现象:QQ能用但是网页打不开。QQ是我们直接访问腾讯的服务器,但是配置的DNS服务器会让我们无法访问网页。
当前要求网站的域名不能重复,保证唯一。全世界这么多网站,如何保证唯一呢?
需要对域名进行分级,一级域名,二级域名,三级域名。
1.按照后缀
域名可以分为gTLD(通用顶级域名)、ccTLD(国别域名)和NEW gTLD(新通用顶级域)三种。
其中我们常用的.com、.net、.org都属于通用顶级域名gTLD;代表中国的.cn、代表日本的.jp、代表美国的.us都属于国别域名ccTLD;.网址、.公司.top、.xyz等都属于新通用顶级域名NEW gTLD。
2.按照结构
按照结构,域名可以分为一级域名(顶级域名)、二级域名、三级域名等等。各级域名由“.”分割。简单来说,有几个点,就属于几级域名。如中科三方的官网www.sfn.cn,就属于一个二级域名。
查询DNS服务器也是分级来查询的,DNS服务器也是分成一级域名服务器、二级域名服务器。
- 本地域名服务器
- 根域名服务器
- 顶级域名服务器
- 权限域名服务器
查询的时候也是一级一级向上查询。
从输入URL到网页呈现的过程
从输入URL到网页呈现的过程大致如下:
- DNS解析
- 建立tcp连接
- 客户端发送HTTP请求
- 服务器处理请求
- 服务器响应请求
- 浏览器展示HTML
- 浏览器发送请求获取其他在HTML中的资源。
DNS解析
当客户端需要域名解析时,通过本机的DNS客户端构造一个DNS请求报文,以UDP数据报方式发往本地域名服务器。
在解析的时候有两种方式:递归、递归与迭代相结合
递归查询
本地域名服务器只需向根域名服务器査询一次,后面的几次查询都是递归地在其他几个域名服务器之间进行的[步骤③~⑥]。在步骤⑦中,本地域名服务器从根域名服务器得到了所需的IP地址,最后在步骤⑧中,本地域名服务器把查询结果告诉发起査询的主机。由于该方法给根域名服务造成的负载过大,所以在实际中几乎不使用。
递归与迭代相结合查询
1.主机向本地域名服务器的查询采用的是递归查询
如果本地主机所询问的本地域名服务器不知道被查询域名的IP地址,那么本地域名服务器就以DNS客户的身份,向根域名服务器继续发出查询请求报文(即替该主机继续查询),而不是让该主机自己进行下一步的查询。两种查询方式的这一步是相同的。
2.本地域名服务器向根域名服务器的查询采用迭代查询
当根域名服务器收到本地域名服务器发出的迭代査询请求报文时,要么给出所要查询的IP地址,要么告诉本地域名服务器:“你下一步应当向哪个顶级域名服务器进行查询”。然后让本地域名服务器向这个顶级域名服务器进行后续的查询。同样,顶级域名服务器收到查询报文后,要么给出所要查询的IP地址,要么告诉本地域名服务器下一步应向哪个权限域名服务器查询。权限域名服务器一定可以得到当前域名对应的IP地址,最后,知道所要解析的域名的IP地址后,把这个结果返回给发起查询的主机。
假定某客户机想获知域名为xyz.com主机的IP地址,域名解析的过程(共使用了8个UDP报文)如下:
①客户机向其本地域名服务器发出DNS请求报文(递归查询)。
②本地域名服务器收到请求后,查询本地缓存,若没有该记录,则以DNS客户的身份向根域名服务器发出解析请求报文(迭代查询)
③根域名服务器收到请求后,判断该域名属于com域,将对应的顶级域名服务器dns.com的IP地址返回给本地域名服务器。
④本地域名服务器向顶级域名服务器dns.com发出解析请求报文(迭代查询)。
⑤顶级域名服务器dns.com收到请求后,判断该域名属于abc.com域,因此将对应的授权域名服务器dns.abc.com的IP地址返回给本地域名服务器。
⑥本地域名服务器向授权域名服务器dns.abc.com发起解析请求报文(迭代查询)
⑦授权域名服务器dns.abc.com收到请求后,将查询结果返回给本地域名服务器。
⑧本地域名服务器将査询结果保存到本地缓存,同时返回给客户机
TCP三次握手连接
HTTP协议是通过TCP协议作为传输层协议的,在拿到服务器的IP地址后,浏览器会和服务器建立TCP连接。
第一步:客户机的TCP首先向服务器的TCP发送连接请求报文段。这个特殊报文段的首部中的同步位SYN置1,同时选择一个初始序号seq=x。TCP规定,SYN报文段不能携带数据,但要消耗掉一个序号。这时,TCP客户进程进入SYN-SENT(同步已发送)状态。
第二步:服务器的TCP收到连接请求报文段后,如同意建立连接,则向客户机发回确认,并为该TCP连接分配缓存和变量。在确认报文段中,把SYN位和ACK位都置1,确认号是ack=x+1,同时也为自己选择一个初始序号seq=y。注意,确认报文段不能携带数据,但也要消耗掉一个序号。这时,TCP服务器进程进入 SYN-RCVD(同步收到)状态。
第三步:当客户机收到确认报文段后,还要向服务器给出确认,并为该TCP连接分配缓存和变量。确认报文段的ACK位置1,确认号ack=y+1,号seq=x+1。该报文段可以携带数据,若不携带数据则不消耗序号。
成功进行以上三步后,就建立了TCP连接,接下来就可以传送应用层数据。TCP提供的是全双工通信,因此通信双方的应用进程在任何时候都能发送数据。另外,值得注意的是,服务器端的资源是在完成第二次握手时分配的,而客户端的资源是在完成第三次握手时分配的,这就使得服务器易于受到SYN洪泛攻击。
客户端发送HTTP请求
浏览器构建http请求报文,并通过TCP协议传送到服务器的指定端口。http请求报文一共包括三个部分:
请求行:指定http请求的方法、url、http协议版本等
首部行:描述浏览器的相关信息,语言、编码等。
请求报文:当发送POST, PUT等请求时,通常需要向服务器传递数据。这些数据就储存在请求正文中。
服务器处理HTTP请求
服务器处理http请求,并返回响应报文。响应报文包括三个部分:
客户端页面渲染
浏览器接受到http服务器发送过来的响应报文,并开始解析html文档,渲染页面。具体的渲染过程包括:构建DOM树、构建渲染树、定位页面元素、绘制页面元素等。
断开TCP连接
客户端与服务器四次挥手,断开tcp连接。
这就是一个具体的从输入URL到网页呈现的过程,重点在于DNS解析和TCP的连接,以及HTTP请求的相关知识。