1.HTTP 基本概念
1.HTTP 是什么?
HTTP 是超文本传输协议
HTTP 是一个在计算机世界里专门在「两点」之间「传输」文字、图片、音频、视频等「超文本」数据的「约定和规范」。
「HTTP 是用于从互联网服务器传输超文本到本地浏览器的协议」,这种说法正确吗?
这种说法是不正确的。因为也可以是「服务器< – >服务器」,所以采用两点之间的描述会更准确。
2.HTTP 常见的状态码有哪些?
1xx 类状态码属于提示信息,是协议处理中的一种中间状态,实际用到的比较少
2xx 类状态码表示服务器成功处理了客户端的请求
「200 OK」是最常见的成功状态码,表示一切正常。如果是非 HEAD 请求,服务器返回的响应头都会有 body 数据
「204 NoContent」也是常见的成功状态码,与 200 OK 基本相同,但响应头没有 body 数据。
「206 Partial Content」是应用于 HTTP 分块下载或断点续传,表示响应返回的 body数据并不是资源的全部,而是其中的一部分,也是服务器处理成功的状态。
3xx 类状态码表示客户端请求的资源发生了变动,需要客户端用新的 URL 重新发送请求获取资源,也就是重定向
「301 Moved Permanently」表示永久重定向,说明请求的资源已经不存在了,需改用新的 URL 再次访问。
「302 Found」表示临时重定向,说明请求的资源还在,但暂时需要用另一个 URL 来访问
301 和 302 都会在响应头里使用字段 Location,指明后续要跳转的 URL,浏览器会自动重定向新的 URL。
「304 NotModified」不具有跳转的含义,表示资源未修改,重定向已存在的缓冲文件,也称缓存重定向,也就是告诉客户端可以继续使用缓存资源,用于缓存控制
4xx 类状态码表示客户端发送的报文有误,服务器无法处理,也就是错误码的含义
「400 Bad Request」表示客户端请求的报文有错误,但只是个笼统的错误。
「403 Forbidden」表示服务器禁止访问资源,并不是客户端的请求出错。
「404 Not Found」表示请求的资源在服务器上不存在或未找到,所以无法提供给客户端。
5xx 类状态码表示客户端请求报文正确,但是服务器处理时内部发生了错误,属于服务器端的错误码。
「500 Internal Server Error」与 400 类型,是个笼统通用的错误码,服务器发生了什么错误,我们并不知道。
「501Not Implemented」表示客户端请求的功能还不支持,类似“即将开业,敬请期待”的意思。
「502 BadGateway」通常是服务器作为网关或代理时返回的错误码,表示服务器自身工作正常,访问后端服务器发生了错误。
「503 Service Unavailable」表示服务器当前很忙,暂时无法响应客户端,类似“网络服务正忙,请稍后重试”的意思。
3.HTTP 常见字段有哪些?
1.Host 字段:客户端发送请求时,用来指定服务器的域名
有了 Host 字段,就可以将请求发往「同一台」服务器上的不同网站
2.Content-Length 字段:服务器在返回数据时,会有 Content-Length 字段,表明本次回应的数据长度
3.Connection 字段:常用于客户端要求服务器使用「HTTP 长连接」机制,以便其他请求复用
HTTP/1.1 版本的默认连接都是长连接,但为了兼容老版本的 HTTP,需要指定 Connection 首部字段的值为 Keep-Alive。
4.Content-Type 字段:用于服务器回应时,告诉客户端,本次数据是什么格式
5.Content-Encoding 字段:说明数据的压缩方法。表示服务器返回的数据使用了什么压缩格式
2.GET 与 POST
根据 RFC 规范,GET 的语义是从服务器获取指定的资源;
GET 请求的参数位置一般是写在 URL 中,URL 规定只能支持 ASCII,所以 GET 请求的参数只允许 ASCII 字符 ,而且浏览器会对 URL 的长度有限制(HTTP协议本身对 URL长度并没有做任何规定)
根据 RFC 规范,POST 的语义是根据请求负荷(报文body)对指定的资源做出处理;
POST 请求携带数据的位置一般是写在报文 body 中,body 中的数据可以是任意格式的数据,只要客户端与服务端协商好即可,而且浏览器不会对 body 大小做限制
安全和幂等的概念:
1.在 HTTP 协议里,所谓的「安全」是指请求方法不会「破坏」服务器上的资源。
2.所谓的「幂等」,意思是多次执行相同的操作,结果都是「相同」的
如果从 RFC 规范定义的语义来看:
1.GET 方法就是安全且幂等的,因为它是「只读」操作,无论操作多少次,服务器上的数据都是安全的,且每次的结果都是相同的。
所以,可以对 GET 请求的数据做缓存,这个缓存可以做到浏览器本身上(彻底避免浏览器发请求),也可以做到代理上(如nginx),而且在浏览器中 GET 请求可以保存为书签。
2.POST 因为是「新增或提交数据」的操作,会修改服务器上的资源,所以是不安全的,且多次提交数据就会创建多个资源,所以不是幂等的。
所以,浏览器一般不会缓存 POST 请求,也不能把 POST 请求保存为书签。
小结:
GET 的语义是请求获取指定的资源。GET 方法是安全、幂等、可被缓存的。
POST 的语义是根据请求负荷(报文主体)对指定的资源做出处理,具体的处理方式视资源类型而不同。POST 不安全,不幂等,(大部分实现)不可缓存
但是实际过程中:
1.可以用 GET 方法实现新增或删除数据的请求,这样实现的 GET 方法自然就不是安全和幂等。
2.可以用 POST 方法实现查询数据的请求,这样实现的 POST 方法自然就是安全和幂等。