HTTP协议请求详解

✏️✏️✏️今天给大家分享的是 HTTP 请求部分的基础知识。

清风的CSDN博客

🛩️🛩️🛩️希望我的文章能对你有所帮助，有不足的地方还请各位看官多多指教，大家一起学习交流！

✈️✈️✈️动动你们发财的小手，点点关注点点赞！在此谢过啦！哈哈哈！😛😛😛

一、HTTP请求格式

二、认识 URL

2.1 URL基本格式

三、认识方法 method

3.1 GET 方法

3.2 POST 方法

3.3 其他方法

五、认识请求正文

一、HTTP请求格式

为什么 HTTP 请求中要存在空行呢？

因为 HTTP 协议并没有规定报头部分的键值对有多少个，空行就相当于是 "报头的结束标记", 或者是 "报头和正文之间的分隔符"。

HTTP 在传输层依赖 TCP 协议, TCP 是面向字节流的，如果没有这个空行, 就会出现 "粘包问题"。

二、认识 URL

2.1 URL基本格式

平时我们俗称的 " 网址 " 其实就是说的 URL (Uniform Resource Locator 统一资源定位符 )，互联网上的每个文件都有一个唯一的URL ，它包含的信息指出文件的位置以及浏览器应该怎么处理它，URL 的详细规则由因特网标准 RFC1738 进行了约定。

一个具体的 URL:

https://v.bitedu.vip/personInf/student?userId=10000&classId=100

可以看到, 在这个 URL 中有些信息被省略了。

https : 协议方案名. 常见的有 http 和 https, 也有其他的类型。(例如访问 mysql 时用的 jdbc:mysql )
user:pass : 登陆信息. 现在的网站进行身份认证一般不再通过 URL 进行了，一般都会省略
v.bitedu.vip : 服务器地址，此处是一个 "域名", 域名会通过 DNS 系统解析成一个具体的 IP 地址。
端口号: 上面的 URL 中端口号被省略了，当端口号省略的时候, 浏览器会根据协议类型自动决定使用哪个端口。例如 http 协议默认使用 80 端口, https 协议默认使用 443 端口.
/personInf/student : 带层次的文件路径。
userId=10000&classId=100 : 查询字符串(query string)，本质是一个键值对结构，键值对之间使用 & 分隔，键和值之间使用 = 分隔。
片段标识: 此 URL 中省略了片段标识. 片段标识主要用于页面内跳转。

关于 query string

query string 中的内容是键值对结构，其中的 key 和 value 的取值和个数, 完全都是程序猿自己约定的，我们可以通过这样的方式来自定制传输我们需要的信息给服务器。

URL 中的可省略部分

协议名: 可以省略, 省略后默认为 http://
ip 地址 / 域名: 在 HTML 中可以省略(比如 img, link, script, a 标签的 src 或者 href 属性)，省略后表示服务器的 ip / 域名与当前 HTML 所属的 ip / 域名一致。
端口号: 可以省略，省略后如果是 http 协议, 端口号自动设为 80; 如果是 https 协议, 端口号自动设为 443。
带层次的文件路径: 可以省略. 省略后相当于 / ，有些服务器会在发现 / 路径的时候自动访问/index.html
查询字符串: 可以省略
片段标识: 可以省略

关于 URL encode

像 / ? : 等这样的字符, 已经被url当做特殊意义理解了，因此这些字符不能随意出现。比如, 某个参数中需要带有这些特殊字符, 就必须先对特殊字符进行转义。

转义的规则如下: 将需要转码的字符转为16进制，然后从右到左，取4位(不足4位直接处理)，每2位做一位，前面加上%，编码成%XY格式

例如：

"+" 被转义成了 "%2B" 。

三、认识方法 method

3.1 GET 方法

GET 是最常用的 HTTP 方法，常用于获取服务器上的某个资源。在浏览器中直接输入 URL, 此时浏览器就会发送出一个 GET 请求。另外, HTML 中的 link, img, script 等标签 , 也会触发 GET 请求。

使用 Fiddler 观察 GET 请求

打开 Fiddler, 访问搜狗主页 , 观察抓包结果。

GET 请求的特点

首行的第一部分为 GET
URL 的 query string 可以为空, 也可以不为空
header 部分有若干个键值对结构
body 部分为空

3.2 POST 方法

POST 方法也是一种常见的方法，多用于提交用户输入的数据给服务器 ( 例如登陆页面 )，通过 HTML 中的 form 标签可以构造 POST 请求 , 或者使用 JavaScript 的 ajax 也可以构造 POST 请求。

使用 Fiddler 观察 POST 方法(随便开一个登录的页面抓包即可)

POST 请求的特点

首行的第一部分为 POST
URL 的 query string 一般为空 (也可以不为空)
header 部分有若干个键值对结构
body 部分一般不为空，body 内的数据格式通过 header 中的 Content-Type 指定，body 的长度由header 中的 Content-Length 指定

GET 和 POST 的区别

语义不同: GET 一般用于获取数据, POST 一般用于提交数据
GET 的 body 一般为空, 需要传递的数据通过 query string 传递, POST 的 query string 一般为空, 需要传递的数据通过 body 传递
GET 请求一般是幂等的, POST 请求一般是不幂等的(如果多次请求得到的结果一样, 就视为请求是幂等的)
GET 可以被缓存, POST 不能被缓存

注意事项：

关于语义: GET 完全可以用于提交数据, POST 也完全可以用于获取数据
关于幂等性: 标准建议 GET 实现为幂等的，实际开发中 GET 也不必完全遵守这个规则
关于安全性: 有些资料上说 "POST 比 GET 请安全"，这样的说法是不科学的，是否安全取决于前端在传输密码等敏感信息时是否进行加密, 和 GET POST 无关
关于传输数据量: 有的资料上说 "GET 传输的数据量小, POST 传输数据量大"，这个也是不科学的, 标准没有规定 GET 的 URL 的长度, 也没有规定 POST 的 body 的长度，传输数据量多少, 完全取决于不同浏览器和不同服务器之间的实现区别
关于传输数据类型: 有的资料上说 "GET 只能传输文本数据, POST 可以传输二进制数据"，这个也是不科学的，GET 的 query string 虽然无法直接传输二进制数据, 但是可以针对二进制数据进行 url encode

3.3 其他方法

PUT 与 POST 相似，只是具有幂等特性，一般用于更新
DELETE 删除服务器指定资源
OPTIONS 返回服务器所支持的请求方法
HEAD 类似于GET，只不过响应体不返回，只返回响应头
TRACE 回显服务器端收到的请求，测试的时候会用到这个
CONNECT 预留，暂无使用

header 的整体的格式也是 " 键值对 " 结构，每个键值对占一行，键和值之间使用分号分割。这里我们了解几个常见的即可。

Host ：表示服务器主机的地址和端口
Content-Length ：表示 body 中的数据长度
Content-Type：表示请求的 body 中的数据格式
User-Agent (简称 UA)

表示浏览器 / 操作系统的属性，形如：

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) 
Chrome/91.0.4472.77 Safari/537.36

Windows NT 10.0; Win64; x64 表示操作系统信息。

AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36 表示浏览器信息。

Referer

表示这个页面是从哪个页面跳转过来的，形如

https://v.bitedu.vip/login

如果直接在浏览器中输入 URL, 或者直接通过收藏夹访问页面时是没有 Referer 的。

Cookie

Cookie 中存储了一个字符串 , 这个数据可能是客户端 ( 网页 ) 自行通过 JS 写入的 , 也可能来自于服务器 ( 服务器在 HTTP 响应的 header 中通过 Set-Cookie 字段给浏览器返回数据 )。

往往可以通过这个字段实现 " 身份标识 " 的功能，每个不同的域名下都可以有不同的 Cookie, 不同网站之间的 Cookie 并不冲突。

比如，有些时候，登录了一个网站之后，后续再访问这个网站的其他页面，都不必重新登录。为了实现身份识别的效果，不仅需要cookie来支持，也需要一个session机制来支持。首次访问网站并登录成功，网站会设定一个身份标识sessioId，身份标识通过服务器返回给浏览器，并保存再cookie中，接下来要访问该网站的其他页面时，cookie会存在于请求报头中，向服务器发出请求，这样就起到了身份识别效果。