HTTP概述
HTTP(HyperTextTransferProtocol)是Web应用的应用层协议,定义浏览器如何向Web服务器发送请求以及Web服务器如何向浏览器进行响应。目前主要使用的HTTP/1.0 和HTTP/1.1,尤其以HTTP/1.1 为主流。
HTTP连接
浏览器在向服务器发送请求之前,首先需要建立TCP连接,然后才能发送HTTP请求报文,并接收HTTP响应报文。根据HTTP使用TCP连接的策略不同,可以分为非持久连接的HTTP和持久连接的HTTP。
- HTTP/1.0 默认的是非持久连接。
- HTTP/1.1 默认使用流水方式持久连接。HTTP/1.1 持久连接默认是激活的。
- HTTP/1.1 代理服务器不应该与HTTP/1.0 客户端建立持久连接。
图解过程使用例子:假如用户在浏览器中输入了URL地址 https://pumg.gitee.io/note/ ,请求浏览器一个引用3个图像的web页面。
非持久连接
非持久连接
指HTTP客户与HTTP服务器建立TCP连接后,通过该连接发送HTTP请求报文,接收HTTP响应报文,然后断开连接。HTTP/1.0默认使用非持久连接。
- 图解 HTTP/1.0 使用非持久连接传输过程
并行连接
通过建立多条并行TCP连接,并行发送HTTP请求和并行接收HTTP响应。
- 图解 HTTP/1.0 使用并行连接传输过程
持久连接
重用已建立的TCP连接发送新的HTTP请求和接收HTTP响应,从而消除新建TCP连接的时间开销。根据使用持久连接传输多个对象的策略不同:非流水方式持久连接和流水方式持久连接。
非流水方式持久连接
客户端在通过持久连接收到前一个响应报文后,才能发出对下一个对象的请求报文,也称为非管道方式持久连接。
- 图解 HTTP/1.1 使用非流水方式持久连接传输过程
流水方式持久连接
客户端在通过持久连接收到前一个响应报文后,才能发出对下一个对象的请求报文,也称为管道方式持久连接。
- 图解 HTTP/1.1 使用流水方式持久连接传输过程
HTTP报文
HTTP 报文可以分为两类:请求报文和响应报文,请求报文由浏览器(客户端)发送给 Web 服务器,响应报文由 Web 服务器发给浏览器。
报文结构图:
请求报文 | 响应报文 | |
---|---|---|
起始行 | <方法> <资源路径> <HTTP版本> | <HTTP版本> <状态码> <原因短语> |
首部行 | 携带附加信息 | 携带附加信息 |
空白行 | 必须有(CRLF) | 必须有(CRLF) |
报文主体 | 实际要传输的内容 | 实际要传输的内容 |
HTTP典型的请求方法:
- GET:请求读取由URL所标识的信息,是最常见的方法。
- HEAD:请求读取由URL所标识的信息的首部。
- POST:给服务器添加信息。
- OPTION:请求一些选项的信息。
- PUT:在指明的URL下存储一个文档
HTTP状态码分类:
响应码 | 类别 | 解释 |
---|---|---|
1xx | Informational(信息性状态码) | 接受的请求正在处理 |
2xx | Success(成功状态码) | 请求正常处理完毕 |
3xx | Redirection(重定向) | 需要进行附加操作以完成请求 |
4xx | Client error(客户端错误) | 客户端请求出错,服务器无法处理请求 |
5xx | Server Error(服务器错误) | 服务器处理请求出错 |
1XX 表示临时响应并需要请求者继续执行操作
- 100 (继续) 请求者应当继续提出请求。 服务器返回此代码表示已收到请求的第一部分,正在等待其余部分。
- 101 (切换协议) 请求者已要求服务器切换协议,服务器已确认并准备切换。
2XX 表示成功处理了请求的状态代码
- 200 (请求成功),服务器已成功处理了请求。 通常,这表示服务器提供了请求的网页。
- 201 (已创建) 请求成功并且服务器创建了新的资源。
- 202 (已接受) 服务器已接受请求,但尚未处理。
- 203 (非授权信息) 服务器已成功处理了请求,但返回的信息可能来自另一来源。
- 204 (无内容) 服务器成功处理了请求,但没有返回任何内容。
- 205 (重置内容) 服务器成功处理了请求,但没有返回任何内容。
- 206 (部分内容) 服务器成功处理了部分 GET 请求。
3XX 表示要完成请求,需要进一步操作。重定向
- 300 (多种选择) 针对请求,服务器可执行多种操作。
- 301 (永久移动) 请求的网页已永久移动到新位置。 服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。
- 302 (临时移动) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。
- 303 (查看其他位置) 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。
- 304 (未修改) 自从上次请求后,请求的网页未修改过。 服务器返回此响应时,不会返回网页内容。
- 305 (使用代理) 请求者只能使用代理访问请求的网页。 如果服务器返回此响应,还表示请求者应使用代理。
- 307 (临时重定向) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。
4XX 这些状态代码表示请求可能出错,妨碍了服务器的处理
- 400 (错误请求) 服务器不理解请求的语法。
- 401 (未授权) 请求要求身份验证。 对于需要登录的网页,服务器可能返回此响应。
- 403 (禁止) 服务器拒绝请求。
- 404 (未找到) 服务器找不到请求的网页。
- 405 (方法禁用) 禁用请求中指定的方法。
- 406 (不接受) 无法使用请求的内容特性响应请求的网页。
- 407 (需要代理授权) 此状态代码与 401(未授权)类似,但指定请求者应当授权使用代理。
- 408 (请求超时) 服务器等候请求时发生超时。
- 409 (冲突) 服务器在完成请求时发生冲突。 服务器必须在响应中包含有关冲突的信息。
- 410 (已删除) 如果请求的资源已永久删除,服务器就会返回此响应。
- 411 (需要有效长度) 服务器不接受不含有效内容长度标头字段的请求。
- 412 (未满足前提条件)服务器未满足请求者在请求中设置的其中一个前提条件。
- 413 (请求实体过大) 服务器无法处理请求,因为请求实体过大,超出服务器的处理能力。
- 414 (请求的 URI 过长) 请求的 URI(通常为网址)过长,服务器无法处理。
- 415 (不支持的媒体类型) 请求的格式不受请求页面的支持。
- 416 (请求范围不符合要求) 如果页面无法提供请求的范围,则服务器会返回此状态代码。
- 417 (未满足期望值) 服务器未满足”期望”请求标头字段的要求。
5XX 一般是服务器问题
- 500 (服务器内部错误) 服务器遇到错误,无法完成请求。
- 501 (尚未实施) 服务器不具备完成请求的功能。 例如,服务器无法识别请求方法时可能会返回此代码。
- 502 (错误网关) 服务器作为网关或代理,从上游服务器收到无效响应。
- 503 (服务不可用) 服务器目前无法使用(由于超载或停机维护)。 通常,这只是暂时状态。
- 504 (网关超时) 服务器作为网关或代理,但是没有及时从上游服务器收到请求。
- 505 (HTTP 版本不受支持) 服务器不支持请求中所用的 HTTP 协议版本。