6-《网络面试》
- 1.http是什么?http的工作机制?http报文?
- 1.1 http工作机制:
- 1.2 URL和http报文
- 2. HTTP请求方法和状态码
- 3.Get和Post的区别
- 4.HTTP的Header解析
- 1.text/html
- 2.x-www-form-urlencoded
- 3.multipart/form-data
- 4.application/json,image/jpeg,application/zip
- 1. 请求中提交json,如:{“name”:“rengwuxian”,“gender”:“male”}
- 2.请求中提交二进制内容:
- 5.TCP/IP协议族
- 1.为什么要分层?
- 2.TCP连接
- 3.TCP为什么建立连接是三次握手,关闭连接却是四次挥手呢?
- 4.TCP和UDP的区别
- 6.http和https
1.http是什么?http的工作机制?http报文?
Hypertext Transfer Protocol 超文本传输协议
1.1 http工作机制:
浏览器:
- 1.用户输入地址后回车或点击链接
- 2.浏览器拼装http报文并发送给服务器
- 3.服务器处理请求后发送响应报文给浏览器
- 4.浏览器解析响应报文并使用渲染引擎显示到界面
手机app:
- 1.用户点击或界面自动触发联网请求
- 2.android 代码调用拼装http报文并发送请求到服务器
- 3.服务器处理请求后发送响应报文给手机
- 4.android代码处理响应报文并做出相应处理(存储数据,显示数据到界面等)
1.2 URL和http报文
URL格式分三部分:协议类型、服务器地址(和端口号)、路径(path)
如:http://baidu.com/user?sex=man
报文格式分为请求报文和响应报文。
请求报文:
响应报文:
2. HTTP请求方法和状态码
请求方法 :
**GET-----------获取资源;没有body
POST---------增加或修改资源;有body
PUT-----------修改资源;有body
DELETE-----删除资源;没有body
HEAD--------与GET类似,但服务器只通过HTTP响应头返回资源的信息(如文件大小,类型等),响应报文段的数据实体为空
状态码:
1xx------------临时性消息(请求已被接受,需要继续处理,如100(继续发送)、101(正在切换协议))
2xx------------成功
3xx------------重定向(如301(永久移动)、302(暂时移动)、304(内容未改变))
4xx------------客户端错误(如400(客户端请求错误)、404(找不到内容))
5xx------------服务器错误**
客户端错误和服务端错误分开,利于程序员调试。
3.Get和Post的区别
标准答案(参考w3schools):
- GET在浏览器回退时是无害的,而POST会再次提交请求。
- GET请求会被浏览器主动cache,而POST不会,除非手动设置。
- GET请求只能进行url编码,而POST支持多种编码方式。
- GET请求参数会被完整保留在浏览器历史记录里,而POST中的参数不会被保留。
- GET请求在URL中传送的参数是有长度限制的,而POST没有。
- 对参数的数据类型,GET只接受ASCII字符,而POST没有限制。
- GET比POST更不安全,因为参数直接暴露在URL上,所以不能用来传递敏感信息。
- GET参数通过URL传递,POST放在Request body中。
- GET产生的URL地址可以被Bookmark,而POST不可以。
“很遗憾,这不是我们要的回答!”
请告诉我真相。。。
如果我告诉你GET和POST本质上没有区别你信吗?
让我们扒下GET和POST的外衣,坦诚相见吧!
HTTP只是个行为准则,而TCP才是GET和POST怎么实现的基本。业界不成文的规定是,(大多数)浏览器通常都会限制url长度在2K个字节,而(大多数)服务器最多处理64K大小的url。超过的部分,恕不处理。如果你用GET服务,在request body偷偷藏了数据,不同服务器的处理方式也是不同的,有些服务器会帮读出数据,有些服务器直接忽略,所以,虽然GET可以带request body,也不能保证一定能被接收到哦。
GET和POST还有一个重大区别,简单的说:
GET产生一个TCP数据包;POST产生两个TCP数据包。
长的说:
对于GET方式的请求,浏览器会把http header和data一并发送出去,服务器响应200(返回数据);
而对于POST,浏览器先发送header,服务器响应100 continue,浏览器再发送data,服务器响应200 ok(返回数据)。
因为POST需要两步,时间上消耗的要多一点,看起来GET比POST更有效。因此Yahoo团队有推荐用GET替换POST来优化网站性能。但这是一个坑!跳入需谨慎。为什么?
-
1.GET与POST都有自己的语义,不能随便混用。
-
2.据研究,在网络环境好的情况下,发一次包的时间和发两次包的时间差别基本可以无视。而在网络环境差的情况下,两次包的TCP在验证数据包完整性上,有非常大的优点。
-
3.并不是所有浏览器都会在POST中发送两次包,Firefox就只发送一次。
4.HTTP的Header解析
扩充知识:DNS查询 Domain Name System 即域名查询系统,通过域名(如api.github.com,域名方便我们记)查询ip地址
Header的作用: HTTP消息的元数据(metadata),主要有:
最常见的Content-Type,主要有4种
1.text/html
请求web页面时返回响应的类型,Body中返回html文本,格式如下
2.x-www-form-urlencoded
web页面纯文本表单的提交方式
对应retrofit的代码:
3.multipart/form-data
web页面含有二进制文件时的提交方式
对应retrofit代码:
4.application/json,image/jpeg,application/zip
单项内容(文本或非文本都可以),用于WebApi的响应或者POST/PUT的请求
1. 请求中提交json,如:{“name”:“rengwuxian”,“gender”:“male”}
对应retrofit代码:
2.请求中提交二进制内容:
对应retrofit代码:
5.TCP/IP协议族
概念:一系列协议组成的一个网络分层模型
1.为什么要分层?
因为网络的不稳定性
具体分层:
应用层:HTTP、FTP、DNS
传输层:TCP、UDP
网络层:IP
数据链路层:以太网、Wi-Fi
2.TCP连接
TCP概述:TCP把连接作为最基本的对象,每一条TCP连接都有两个端点,这种端点我们叫作套接字(socket),它的定义为端口号拼接到IP地址即构成了套接字,例如,若IP地址为192.3.4.16 而端口号为80,那么得到的套接字为192.3.4.16:80。
什么叫连接?
通信双方建立确认可以通信,不会讲对方的消息丢弃,即为建立连接。
为什么要有长连接?
因为移动网络并不在internet中,而是在运营商的内网,并不具有真正的公网ip,因此当某个TCP连接在一段时间不通信后,网关会出于性能考虑关闭这条TCP连接和网关的连接通道,导致TCP连接被动关闭
长连接的实现方式
心跳机制。即在一定时间间隔内,使用TCP连接发送超短无意义消息来让网关不能讲自己定义为空闲连接,从而防止网关将自己关闭。
此外,长连接并不是永久连接的。如果一段时间内(具体的时间长短,是可以在header当中进行设置的,也就是所谓的超时时间),这个连接没有HTTP请求发出的话,那么这个长连接就会被断掉。
3.TCP为什么建立连接是三次握手,关闭连接却是四次挥手呢?
字段含义:主要了解下ACK(确认)、SYN(同步)、FIN(终止)
序列号seq:占4个字节,用来标记数据段的顺序,TCP把连接中发送的所有数据字节都编上一个序号,第一个字节的编号由本地随机产生;给字节编上序号后,就给每一个报文段指派一个序号;序列号seq就是这个报文段中的第一个字节的数据编号。
确认号ack:占4个字节,期待收到对方下一个报文段的第一个数据字节的序号;序列号表示报文段携带数据的第一个字节的编号;而确认号指的是期望接收到下一个字节的编号;因此当前报文段最后一个字节的编号+1即为确认号。
确认ACK:占1位,仅当ACK=1时,确认号字段才有效。ACK=0时,确认号无效
同步SYN:连接建立时用于同步序号。当SYN=1,ACK=0时表示:这是一个连接请求报文段。若同意连接,则在响应报文段中使得SYN=1,ACK=1。因此,SYN=1表示这是一个连接请求,或连接接受报文。
SYN这个标志位只有在TCP建产连接时才会被置1,握手完成后SYN标志位被置0。
终止FIN:用来释放一个连接。FIN=1表示:此报文段的发送方的数据已经发送完毕,并要求释放运输连接
PS:ACK、SYN和FIN这些大写的单词表示标志位,其值要么是1,要么是0;ack、seq小写的单词表示序号。
三次握手过程解析:
第一次握手:建立连接时,客户端发送syn包(syn=j)到服务器,并进入SYN_SENT状态,等待服务器确认;SYN:同步序列编号(Synchronize Sequence Numbers)。
第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时自己也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器进入SYN_RECV状态;
第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED(TCP连接成功)状态,完成三次握手。
三次握手总结:建立连接的时候, 服务器在LISTEN状态下,收到建立连接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端。
四次挥手过程解析:
-
1)客户端进程发出连接释放报文,并且停止发送数据。释放数据报文首部,FIN=1,其序列号为seq=u(等于前面已经传送过来的数据的最后一个字节的序号加1),此时,客户端进入FIN-WAIT-1(终止等待1)状态。 TCP规定,FIN报文段即使不携带数据,也要消耗一个序号。
-
2)服务器收到连接释放报文,发出确认报文,ACK=1,ack=u+1,并且带上自己的序列号seq=v,此时,服务端就进入了CLOSE-WAIT(关闭等待)状态。TCP服务器通知高层的应用进程,客户端向服务器的方向就释放了,这时候处于半关闭状态,即客户端已经没有数据要发送了,但是服务器若发送数据,客户端依然要接受。这个状态还要持续一段时间,也就是整个CLOSE-WAIT状态持续的时间。
-
3)客户端收到服务器的确认请求后,此时,客户端就进入FIN-WAIT-2(终止等待2)状态,等待服务器发送连接释放报文(在这之前还需要接受服务器发送的最后的数据)。
-
4)服务器将最后的数据发送完毕后,就向客户端发送连接释放报文,FIN=1,ack=u+1,由于在半关闭状态,服务器很可能又发送了一些数据,假定此时的序列号为seq=w,此时,服务器就进入了LAST-ACK(最后确认)状态,等待客户端的确认。
-
5)客户端收到服务器的连接释放报文后,必须发出确认,ACK=1,ack=w+1,而自己的序列号是seq=u+1,此时,客户端就进入了TIME-WAIT(时间等待)状态。注意此时TCP连接还没有释放,必须经过2∗∗MSL(最长报文段寿命)的时间后,当客户端撤销相应的TCB后,才进入CLOSED状态。
-
6)服务器只要收到了客户端发出的确认,立即进入CLOSED状态。同样,撤销TCB后,就结束了这次的TCP连接。可以看到,服务器结束TCP连接的时间要比客户端早一些。
四次挥手总结:关闭连接时,服务器收到对方的FIN报文时,仅仅表示对方不再发送数据了但是还能接收数据,而自己也未必全部数据都发送给对方了,所以己方可以立即关闭,也可以发送一些数据给对方后,再发送FIN报文给对方来表示同意现在关闭连接,因此,己方ACK和FIN一般都会分开发送,从而导致多了一次。
常见面试题
【问题1】为什么连接的时候是三次握手,关闭的时候却是四次握手?
答:因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文。其中SYN报文是用来同步的,ACK报文是用来应答的。
但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,“你发的FIN报文我收到了”。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步挥手。
【问题2】为什么TIME_WAIT状态需要经过2MSL(最大报文段生存时间)才能返回到CLOSE状态?
答:虽然按道理,四个报文都发送完毕,我们可以直接进入CLOSE状态了,但是我们必须假象网络是不可靠的,有可以最后一个ACK丢失。所以TIME_WAIT状态就是用来重发可能丢失的ACK报文。在Client发送出最后的ACK回复,但该ACK可能丢失。Server如果没有收到ACK,将不断重复发送FIN片段。所以Client不能立即关闭,它必须确认Server接收到了该ACK。Client会在发送出ACK之后进入到TIME_WAIT状态。Client会设置一个计时器,等待2MSL的时间。如果在该时间内再次收到FIN,那么Client会重发ACK并再次等待2MSL。所谓的2MSL是两倍的MSL(Maximum Segment Lifetime)。MSL指一个片段在网络中最大的存活时间,2MSL就是一个发送和一个回复所需的最大时间。如果直到2MSL,Client都没有再次收到FIN,那么Client推断ACK已经被成功接收,则结束TCP连接。
【问题3】为什么不能用两次握手进行连接?
答:3次握手完成两个重要的功能,既要双方做好发送数据的准备工作(双方都知道彼此已准备好),也要允许双方就初始序列号进行协商,这个序列号在握手过程中被发送和确认。
(第一次握手告知服务端,第二次握手服务端告知客户端装备好了,第三次握手客户端告诉服务端专备好了。)
【问题4】如果已经建立了连接,但是客户端突然出现故障了怎么办?
TCP还设有一个保活计时器,显然,客户端如果出现故障,服务器不能一直等下去,白白浪费资源。服务器每收到一次客户端的请求后都会重新复位这个计时器,时间通常是设置为2小时,若两小时还没有收到客户端的任何数据,服务器就会发送一个探测报文段,以后每隔75秒钟发送一次。若一连发送10个探测报文仍然没反应,服务器就认为客户端出了故障,接着就关闭连接。
详细可以阅读两张动图-彻底明白TCP的三次握手与四次挥手
4.TCP和UDP的区别
基于连接与无连接;
对系统资源的要求(TCP较多,UDP少);
UDP程序结构较简单;
流模式与数据报模式 ;
TCP保证数据正确性,UDP可能丢包
TCP保证数据顺序,UDP不保证。
6.http和https
HTTP over SSL 的简称,即工作在SSL(或TLS)上的http。https 通过在 http 协议下添加了一层 ssl 协议对数据进行加密从而保证了安全。说白了,就是加密通信的http。
工作原理:
在客户端和服务器之间协商出一套对称秘钥,每次发送信息之前讲内容加密,收到之后解密,达到内筒加密传输。
为什么不直接使用非对称加密?
非对称加密由于使用了复杂的数学原理,因此计算相当复杂,如果完全使用非对称加密来加密通信内容,会严重影响网络通信的性能。
http 与 https 的区别主要如下:
- 1.https 需要到 CA 申请证书,很少免费,因而需要一定的费用
- 2.http 是明文传输,安全性低;而 https 在 http 的基础上通过 ssl 加密,安全性高
- 3.http 使用的默认端口是80;https使用的默认端口是 443
建议阅读:网络面试题