从零开始学习http协议
- 1 知识回顾
- 2 认识网络重定向
- 3 http请求方法
- 3.1 http常见请求方法
- 3.2 postman工具进行请求
- 3.3 处理GET和POST参数
1 知识回顾
前面两篇文章中我们学习并实现了http协议下的请求与应答:
- http请求包括四个部分:请求行 , 报头 , 空行 , 请求正文。请求行中的URL是客户端想要获取的资源,这是对于服务器来说最重要的部分,服务器后续通过URL在网络根目录中搜索对应的资源,然后通过应答报文返回。
- http应答包括四个部分:状态行 , 报头 , 空行 , 应答正文。应答正文中包含从服务器返回的实际内容,如HTML页面、图片或其他数据。
- 请求与应答中的报头都是用于传输请求和应答的一些基础信息,以键值对的形式储存。
http协议作为通信协议,必然要支持序列化与反序列化。我们需要做的是服务器的操作,只需要进行请求的反序列化和应答的序列化就可以了,请求的序列化和应答的反序列化是浏览器(客户端)需要考虑的。要做到序列化和反序列化需要按照请求和应答的结构,从字符串中读取分离出来,具体操作可以参考之前的文章:
- 【计网】从零开始学习http协议 — http的请求与应答
- 【计网】从零开始学习http协议 — 通过http实现客户端交互
实现了http协议中服务器的序列化和反序列化,接下来就可以加入一些资源来供客户端获取。
对于状态行的http版本与http状态码,我们也有了初步的了解:
- http版本:浏览器和服务端需要互相告诉各自的版本号,进而做到对应的处理!因为http协议会不断更新,不能保证对方是否更新协议!
- http状态码:状态码是服务器做出应答时根据数据处理的情况返回给浏览器。每个状态码对应一种情况!
2 认识网络重定向
状态码中3XX
是代表重定向的:
状态码 | 含义 |
---|---|
301 | Moved Permanently 永久重定向 |
302 | Found 临时重定向 |
307 | Temporary Redirect 临时重定向资源到新位置 |
308 | Permanent Redirect 永久重定向资源到新位置 |
其中大部分使用301 302,307 308很少使用!我们介绍一下临时重定向和永久重定向。
首先,网络中的重定向和文件的重定向概念上比较类似。一般来说,我们访问对应的网址会直接找到对应的服务器进程。当这个服务器让课客户端重新进行请求另一个服务器时,此时就是重定向!
举个例子:学校南门口有一家非常好吃的饺子馆,小明经常去那里吃饭。后来因为道路施工问题,饺子馆搬到看学校北门口,并为了让老客户可以找到新地址,在原来门店贴上新地址。小明这天去了,看到了这个告示,就知道应该去北门口找到这家饺子馆,这就是重定向!以后小明在想去饺子馆应该去老地址还是新地址呢?
这就需要分两种情况:
- 如果饺子馆是临时搬到北门口,那么小明一个去原南门口的饺子馆看看,再来决定是否去北门口。
- 如果饺子馆是永久搬到北门口,那么下面不用犹豫,直接就去北门口就可以!
这里的两种情况就是临时重定向和永久重定向的区别:临时重定向只修改一次,下次客户端依然访问原网址。永久重定向会永久修改,下次客户端直接访问新地址!
实际应用中,也有实际的例子:
甲公司使用www.hello.com网址使用了很多年,积攒了很多用户。后来甲公司将公司网址改成了www.world.com
那么下一次老用户访问原网址时,对老客户进行重定向访问到新网址,并修改老客户中浏览器中的对应网址信息。这就是永久重定向!
永久重定向是给搜索引擎看的!每个搜索引擎都会抓取全国各个网站的网址信息,然后建立起键值对。每次搜索时就可以通过关键词搜索到对应的网站。这个抓取是不断进行的。当一个网站的网址永久更改时,在原网址设置重定向到新网址,客户端每次进到原网址都要进行一次重定向,每次都进行重定向就太麻烦了!所以浏览器发现永久重定向之后就会修改内部信息,下次就会直接访问到新网址!
我们可以在服务器中测试一下重定向!
我们在页面中加入一个测试重定向的链接,这个链接会请求/redir
资源,这个资源实际上并不存在,只是用来进行是否进行重定向的判断依据!
这样点入链接之后,就会再次发送请求/redir
这个资源,我们可以在处理时进行一个硬处理,当客户端访问这个资源时进行一个特殊处理:
if (hreq.Path() == "wwwroot/redir")
{
// 进行重定向
LOG(DEBUG, "进行重定向!!!\n");
std::string redir_path = "https://www.qq.com"; // 重定向的新地址
resp.AddCode(302, _code_to_desc[302]);
resp.AddHeader("Location", redir_path);
// resp.AddBody(content);
}
else
{
//...
}
这样进行序列化返回给浏览器之后,浏览器会自动识别,然后就跳转到新的网址中了!!!
非常好玩,这个现象就是重定向!!!
3 http请求方法
3.1 http常见请求方法
在http请求中有请求行,请求行中有一个参数:请求方法_method
。这个请求方法到底是干什么用的呢?
http中有以下请求方法:
请求方法 | 方法说明 | 适配HTTP版本 |
---|---|---|
GET | 请求指定的资源。一般用于信息查询,不应产生副作用。 | HTTP/1.0 |
POST | 向指定的资源提交数据进行处理请求(例如提交表单或上传文件)。 | HTTP/1.0 |
PUT | 向指定资源位置上传其最新内容。 | HTTP/1.0 |
DELETE | 请求服务器删除Request-URI所标识的资源。 | HTTP/1.0 |
HEAD | 类似于GET请求,但响应体不会返回,用于获取报头信息。 | HTTP/1.0 |
OPTIONS | 用于描述目标资源的通信选项。 | HTTP/1.1 |
TRACE | 回显服务器收到的请求,主要用于测试或诊断。 | HTTP/1.1 |
CONNECT | 用于将连接改为管道方式的代理服务器。 | HTTP/1.1 |
PATCH | 对资源进行部分修改。 | HTTP/1.1 |
其中最常见的就是GET
方法和POST
方法。 平时使用浏览器一般都是获取资源,就是进行GET。有时也会进行登录注册,这时会向服务器发送资源,就是进行POST!那么浏览器是如何进行呢?
我们可以在服务器中加入打印客户端请求方法,这样我们可以看到:
可以看到只要是获取资源都是使用的GET方法!
3.2 postman工具进行请求
那我们可以进行GET方法了,怎么进行POST方法呢?可以使用postman
这个工具:
Postman提供了一个直观的界面来构建HTTP请求,包括设置请求头、请求体、认证等。
Postman允许用户发送各种HTTP请求(如GET, POST, PUT, DELETE等)到API端点,并检查响应。它支持测试脚本,可以自动验证响应数据。
我们通过postman快速创建http请求,使用POST方法发送。
这样服务器就得到了POST方法的请求。
GET方法不光可以获取数据,也可以向服务器发送数据。POST方法也可以向服务器推送数据!
我们可以在postman中加入两个键值对:
这样我们再次请求时,就会发现我们可以通过url向服务器进行传参了!
我们在使用POST方法试一试,POST方法需要再请求的正文中加入参数:
这样服务器会得到一个请求,这个请求正文中包含了传入的参数!
总结:
- GET方法一般用来获取静态资源,也可以通过URL向服务器传递参数。
- POST方法可以通过http请求的正文来进行参数的传递。
- URL传参,参数的体量一定不大;正文传参,参数的体量可以很大!
3.3 处理GET和POST参数
但是在用户的实际使用中,用户不可能像POSTMAN一样可以手动选择请求方法,那么实际应用中,是通过前端的form表单完成GET和POST请求!
<div>
<!-- 默认就是GET -->
<form action="/login" method="POST">
用户名: <input type="text" name="username" value="."><br>
密码: <input type="password" name="userpasswd" value=""><br>
<input type="submit" value="提交">
</form>
</div>
这里最后使用POST方法,因为使用GET方法,会将参数加入到URL中,这样其他人可以就能够看到用户和密码了,这样可不行!
那么服务器如何处理参数呢?这个action="/login"
又是什么含义呢?
- 当使用POST方法时,参数是写在正文中的,那么直接直接按照规则进行解析就可以了!
- 如果使用GET方法,参数是加在URL中的。如果不做处理,会影响我们后续的很多操作,所以需要对URL进行处理!将真正的URL提取出来,并在正文中储存参数!
// 解析参数 --- 忽略大小写进行比较 if (strcasecmp(_method.c_str(), "GET") == 0) { //寻找 ? auto pos = _url.find(arg_sep); //包含?说明带参数 if(pos != std::string::npos) { _req_body_text = _url.substr(pos + arg_sep.size()); _url.resize(pos); } }
这样不管是使用的什么方法传递的参数,我们都可以通过正文中获取参数了!
接下来我们来看action="/login"
,这个资源我们并不存在啊?这个action需要怎么处理呢?
我们在httpserver中加入一系列的服务名称与服务函数的哈希对应。
using func_t = std::function<HttpResponse(HttpRequest)>;
std::unordered_map<std::string , func_t> server_list;
void InsertService(const std::string servicename , func_t f)
{
//加入网络根目录!
std::string s = prefixpath + servicename;
_server_list[s] = f;
}
那么对于"/login"
我们可以插入一个:
hserver.InsertService("/login" , login);
那么服务器可以在处理请求之后,进行特殊处理。识别出来action是"/login"时,就可以去执行func_t函数,然后可以返回对应的应答!
if (hreq.Path() == "wwwroot/redir")
{
// 进行重定向
LOG(DEBUG, "进行重定向!!!\n");
//...
}
else if (!hreq.GetRequestBody().empty())
{
if (IsServiceExists(hreq.Path()))
{
resp = _server_list[hreq.Path()](hreq);
}
}
这样就实现了对action的处理!!!所以http不光可以处理静态资源,也可以处理函数!
我们就可以设计一个处理login的方法:
HttpResponse Login(HttpRequest &req)
{
HttpResponse resp;
std::cout << "外部已经拿到了参数了: " << std::endl;
req.GetRequestBody();
std::cout << "####################### " << std::endl;
resp.AddCode(200, "OK");
resp.AddBody("<html><h1>result done!</h1></html>");
// username=helloworld&userpasswd=123456
//可以进行很多种的操作!
// 1. pipe
// 2. dup2
// 3. fork();
// 4. 其他进程执行 -> exec* -> python, PHP, 甚至是Java!
return resp;
}
这样我们能处理不同的action了:
通过这种方式,我们可以通过回调函数func_t
进行可以进行很多操作了:
- pipe创建管道
- dup2进行重定向
- fork创建子进程
- exec*系列进行进程替换
因为C++语言处理业务并不擅长,但是c++处理底层十分快速!所以我们可以通过管道或者新的进程将数据交给python或者java这样的web语言来处理,然后在将数据返回给服务器,服务器处理好之后将http应答交给客户端!
这样服务器中各种语言的关系我们也就大概了解了!!!
我们可以来看一个浏览器的实例:
其中的https://cn.bing.com/search?q=helloworld
,我们可以大致了解其中的原理:
/s
应该就是search服务,告诉服务器去执行搜索服务,这个服务不确定是什么语言进行的!- 参数
q=helloworld
,是使用GET
方法传给服务器的!也就是我们要搜索的内容!
通过F12查看页面信息我们也能找到对应的form表单:
这里的action就是/search
!