客户端通过浏览器请求网址或网页资源的步骤如下:
http请求网址或网页的全流程
- 1.首先,浏览器做的第一步就是解析 URL 得到里面的参数
- 2.浏览器封装 HTTP 请求报文
- 3.DNS 域名解析获取 IP 地址
- 4. 建立 TCP 连接
- 5.浏览器发送请求
- 6.负责传输的 IP 协议
- 7.使用 ARP 协议凭借 MAC 地址通信
- 8.服务器响应请求
- 9.断开 TCP 连接
- 10.浏览器显示界面
拓扑模型图
1.首先,浏览器做的第一步就是解析 URL 得到里面的参数
将域名和需要请求的资源分离开来,从而了解需要请求的是哪个服务器,请求的是服务器上什么资源等等
2.浏览器封装 HTTP 请求报文
对 url 进行解析之后,浏览器确定了目标服务器和文件名,接下来就需要根据这些消息「封装」成一个 HTTP 请求报对URL文发送出去
3.DNS 域名解析获取 IP 地址
封装好 HTTP 请求报文后,在正式还有一项准备工作没有做,那就是获取目标服务器的 IP 地址。
虽然解析得到了域名,理论浏览器已经知道目标服务器是谁了。但是实际上,域名并不是目标服务器真正意义上的地址,互联网上每一台计算机都被全世界唯- IP 地址标识着,但是 IP 地址并不方便记忆,所以才设计出了域名。那么就需要解析域名获取目标服务器的IP 地址。不然空有一个方便记忆的域名咋知道这个请求到底发送到哪里去呢。由域名转换得到 IP 地址就是 DNS 协议做的事情
- 首先搜索「浏览器的 DNS 缓存」,缓存中维护着一张域名与 IP 地址的对应表;
- 若没有命中,则继续搜索「操作系统的 DNS 缓存」;
- 若仍然没有命中,则操作系统将域名发送至「本地域名服务器」,本地域名服务器查询自己的 DNS 缓存,查找成功则返回结果(注意:主机和本地域名服务器之间的查询方式是「递归查询」);
- 若本地域名服务器的 DNS 缓存没有命中,则本地域名服务器向上级域名服务器进行查询,通过以下方式进行「迭代查询」(注意:本地域名服务器和其他域名服务器之间的査询方式是迭代查询,防止根域名服务器压力过大):
- 首先本地域名服务器向「根域名服务器」发起请求,根域名服务器是最高层次的,它并不会直接指明这个域名对应的IP 地址,而是返回顶级域名服务器的地址,也就是说给本地域名服务器指明一条道路,让他去这里寻找答案
- 本地域名服务器拿到这个「顶级域名服务器」的地址后,就向其发起请求,获取「权限域名服务器」的地址
- 本地域名服务器根据权限域名服务器的地址向其发起请求,最终得到该域名对应的 IP 地址
- 本地域名服务器将得到的 IP 地址返回给操作系统,同时自己将IP 地址缓存起来
- 操作系统将 IP 地址返回给浏览器,同时自己也将 IP 地址缓存起来
- 至此,浏览器就得到了域名对应的IP 地址,并将IP 地址缓存起来
4. 建立 TCP 连接
获取到了目标服务器的 IP 地址之后,浏览器就知道我等下请求要发给谁了,这个时候就可以开始发送封装好了的 HTTP请求报文了,那么既然需要发送请求,必然就需要 TCP 通过三次握手为浏览器和服务器之间建立可靠的连接,「保证双方都具有可靠的接收和发送能力」。tcp如何建立和断开连接可以去看我的上一篇博客:三次握手和四次挥手详解
5.浏览器发送请求
TCP 三次握手完成后,浏览器与目标服务器之间就建立了一个可靠的虚拟通道,于是浏览器就可以发送自己的 HTTP 请求,需要注意的是,HTTP 请求报文或者响应报文在 TCP 连接通道上进行传输的时候,由于这些报文比较大,为了更容易和准确可靠的传输,「TCP 会将 HTTP 报文按序号分割成若干报文段并加上 TCP 首部,分别进行传输。接收方在收到这些报文段后,按照序号以原来的顺序重组 HTTP 报文」。
数据会被以 mss(下面有介绍) 的长度为单位进行拆分,拆分出来的每一块数据都会被放进单独的网络包中。也就是在每个被拆分的数据加上 TCP 头信息,然后交给IP 模块来发送数据。
6.负责传输的 IP 协议
实际上,TCP 在三次握手建立连接、四次握手断开连接、以及连接建立过程中的收发数据(TCP 报文段)等各阶段操作时,都是通过 IP 协议进行传输的,IP 协议将这些阶段的数据添加 IP 首部封装成 IP 数据报再进行传输IP 数据报的首部存有「源 IP 地址」和 「[目标 IP 地址」。所谓源 |P 地址 就是发送方的IP 地址;目标 IP 地址就是通过DNS 域名解析得到的目标服务器的 IP 地址。事实上,「IP 协议身处的网络层规定的是:数据报要通过怎样的路径(传输路线)才能到达对方计算机,并传送给对方」。
- MTU:一个网络包的最大长度,以太网中一般为1500 字节
- MSS:除去 IP 和 TCP 头部之后,一个网络包所能容纳的 TCP 数据的最大长度。
在 IP 协议里面需要有源地址 IP 和 目标地址 IP:
- 源地址IP,即是客户端输出的IP 地址:
- 目标地址,即通过 DNS 域名解析得到的 Web 服务器 IP。
7.使用 ARP 协议凭借 MAC 地址通信
在传输一个 IP 数据报的时候,确定了源 IP 地址和目标IP 地址后,就会通过主机「路由表」确定 IP 数据包下一跳。然而,网络层的下一层是数据链路层,所以我们还要知道「下一跳」的 MAC 地址。由于主机的路由表中可以找到下一跳的 IP 地址,所以可以通过 ARP 协议,求得下一跳的 MAC 地址。那么 ARP 又是如何知道对方 MAC 地址的呢?
- 主机会通过广播发送 ARP 请求,这个包中包含了想要知道的 MAC 地址的主机 IP 地址。
- 当同个链路中的所有设备收到 ARP 请求时,会去拆开 ARP 请求包里的内容,如果 ARP 请求包中的目标 IP 地址与自己的 IP 地址一致,那么这个设备就将自己的 MAC 地址塞入 ARP 响应包返回给主机。
操作系统通常会把第一次通过 ARP 获取的 MAC地址缓存起来,以便下次直接从缓存中找到对应 IP 地址的 MAC 地址。
8.服务器响应请求
浏览器的 HTTP 请求报文通过 TCP 三次握手建立的连接通道被切分成若干报文段分别发送给服务器,服务器在收到这些报文段后,按照序号以原来的顺序重组 HTTP 请求报文。然后处理并返回一个 HTTP 响应。当然,HTTP 响应报文也要经过和 HTTP 请求报文一样的过程。
数据包抵达服务器后,服务器会先扒开数据包的 MAC 头部,查看是否和服务器自己的 MAC 地址符合,符合就将包收起来。
接着继续扒开数据包的 IP 头,发现 IP 地址符合,根据 IP 头中协议项,知道自己上层是 TCP 协议。
于是,扒开 TCP 的头,里面有序列号,需要看一看这个序列包是不是我想要的,如果是就放入缓存中然后返回一个 ACK,如果不是就丢弃。TCP头部里面还有端口号, HTTP 的服务器正在监听这个端口号。
于是,服务器自然就知道是 HTTP 进程想要这个包,于是就将包发给 HTTP 进程。
服务器的 HTTP 进程看到,原来这个请求是要访问一个页面,于是就把这个网页封装在 HTTP 响应报文里。
HTTP 响应报文也需要穿上 TCP、IP、MAC 头部,不过这次是源地址是服务器 IP 地址,目的地址是客户端 IP 地址。
穿好头部衣服后,从网卡出去,交由交换机转发到出城的路由器,路由器就把响应数据包发到了下一个路由器,就这样跳啊跳。
最后跳到了客户端的城门把守的路由器,路由器扒开 IP 头部发现是要找城内的人,于是又把包发给了城内的交换机,再由交换机转发到客户端。
客户端收到了服务器的响应数据包后,同样也非常的高兴,客户能拆快递了!
于是,客户端开始扒皮,把收到的数据包的皮扒剩 HTTP 响应报文后,交给浏览器去渲染页面,一份特别的数据包快递,就这样显示出来了!
最后,客户端要离开了,向服务器发起了 TCP 四次挥手,至此双方的连接就断开了。
9.断开 TCP 连接
浏览器和服务器都不再需要发送数据后,四次挥手断开 TCP 连接,tcp如何建立和断开连接可以去看我的上一篇博客:三次握手和四次挥手详解
10.浏览器显示界面
浏览器接收到服务器返回的 HTTP 响应报文后,根据浏览器的渲染机制对相应的数据进行渲染