【计网】【计网】从零开始学习http协议 ---理解http重定向和请求方法

在这里插入图片描述

去光荣地受伤，

去勇敢地痊愈自己。

--- 简嫃《水问》---

从零开始学习http协议

1 知识回顾
2 认识网络重定向
3 http请求方法
- 3.1 http常见请求方法
- 3.2 postman工具进行请求
- 3.3 处理GET和POST参数

1 知识回顾

前面两篇文章中我们学习并实现了http协议下的请求与应答：

http请求包括四个部分：请求行，报头，空行，请求正文。请求行中的URL是客户端想要获取的资源，这是对于服务器来说最重要的部分，服务器后续通过URL在网络根目录中搜索对应的资源，然后通过应答报文返回。
http应答包括四个部分：状态行，报头，空行，应答正文。应答正文中包含从服务器返回的实际内容，如HTML页面、图片或其他数据。
请求与应答中的报头都是用于传输请求和应答的一些基础信息，以键值对的形式储存。

http协议作为通信协议，必然要支持序列化与反序列化。我们需要做的是服务器的操作，只需要进行请求的反序列化和应答的序列化就可以了，请求的序列化和应答的反序列化是浏览器（客户端）需要考虑的。要做到序列化和反序列化需要按照请求和应答的结构，从字符串中读取分离出来，具体操作可以参考之前的文章：

【计网】从零开始学习http协议 — http的请求与应答
【计网】从零开始学习http协议 — 通过http实现客户端交互

实现了http协议中服务器的序列化和反序列化，接下来就可以加入一些资源来供客户端获取。
对于状态行的http版本与http状态码，我们也有了初步的了解:

http版本：浏览器和服务端需要互相告诉各自的版本号，进而做到对应的处理！因为http协议会不断更新，不能保证对方是否更新协议！
http状态码：状态码是服务器做出应答时根据数据处理的情况返回给浏览器。每个状态码对应一种情况！

2 认识网络重定向

状态码中3XX是代表重定向的：

状态码	含义
301	Moved Permanently 永久重定向
302	Found 临时重定向
307	Temporary Redirect 临时重定向资源到新位置
308	Permanent Redirect 永久重定向资源到新位置

其中大部分使用301 302,307 308很少使用！我们介绍一下临时重定向和永久重定向。

首先，网络中的重定向和文件的重定向概念上比较类似。一般来说，我们访问对应的网址会直接找到对应的服务器进程。当这个服务器让课客户端重新进行请求另一个服务器时，此时就是重定向！

举个例子：学校南门口有一家非常好吃的饺子馆，小明经常去那里吃饭。后来因为道路施工问题，饺子馆搬到看学校北门口，并为了让老客户可以找到新地址，在原来门店贴上新地址。小明这天去了，看到了这个告示，就知道应该去北门口找到这家饺子馆，这就是重定向！以后小明在想去饺子馆应该去老地址还是新地址呢？
这就需要分两种情况：

如果饺子馆是临时搬到北门口，那么小明一个去原南门口的饺子馆看看，再来决定是否去北门口。
如果饺子馆是永久搬到北门口，那么下面不用犹豫，直接就去北门口就可以！

这里的两种情况就是临时重定向和永久重定向的区别：临时重定向只修改一次，下次客户端依然访问原网址。永久重定向会永久修改，下次客户端直接访问新地址！

实际应用中，也有实际的例子：

甲公司使用www.hello.com网址使用了很多年，积攒了很多用户。后来甲公司将公司网址改成了www.world.com
那么下一次老用户访问原网址时，对老客户进行重定向访问到新网址，并修改老客户中浏览器中的对应网址信息。这就是永久重定向！

永久重定向是给搜索引擎看的！每个搜索引擎都会抓取全国各个网站的网址信息，然后建立起键值对。每次搜索时就可以通过关键词搜索到对应的网站。这个抓取是不断进行的。当一个网站的网址永久更改时，在原网址设置重定向到新网址，客户端每次进到原网址都要进行一次重定向，每次都进行重定向就太麻烦了！所以浏览器发现永久重定向之后就会修改内部信息，下次就会直接访问到新网址！
在这里插入图片描述
我们可以在服务器中测试一下重定向！
我们在页面中加入一个测试重定向的链接，这个链接会请求/redir资源，这个资源实际上并不存在，只是用来进行是否进行重定向的判断依据！

这样点入链接之后，就会再次发送请求/redir这个资源，我们可以在处理时进行一个硬处理，当客户端访问这个资源时进行一个特殊处理：

	if (hreq.Path() == "wwwroot/redir")
    {
        // 进行重定向
        LOG(DEBUG, "进行重定向！！！\n");
        std::string redir_path = "https://www.qq.com"; // 重定向的新地址
        resp.AddCode(302, _code_to_desc[302]);
        resp.AddHeader("Location", redir_path);
        // resp.AddBody(content);
    }
    else
    {
		//...
	}

这样进行序列化返回给浏览器之后，浏览器会自动识别，然后就跳转到新的网址中了！！！
在这里插入图片描述
非常好玩，这个现象就是重定向！！！

3 http请求方法

3.1 http常见请求方法

在http请求中有请求行，请求行中有一个参数：请求方法_method。这个请求方法到底是干什么用的呢？

http中有以下请求方法：

请求方法	方法说明	适配HTTP版本
GET	请求指定的资源。一般用于信息查询，不应产生副作用。	HTTP/1.0
POST	向指定的资源提交数据进行处理请求（例如提交表单或上传文件）。	HTTP/1.0
PUT	向指定资源位置上传其最新内容。	HTTP/1.0
DELETE	请求服务器删除Request-URI所标识的资源。	HTTP/1.0
HEAD	类似于GET请求，但响应体不会返回，用于获取报头信息。	HTTP/1.0
OPTIONS	用于描述目标资源的通信选项。	HTTP/1.1
TRACE	回显服务器收到的请求，主要用于测试或诊断。	HTTP/1.1
CONNECT	用于将连接改为管道方式的代理服务器。	HTTP/1.1
PATCH	对资源进行部分修改。	HTTP/1.1

其中最常见的就是GET方法和POST方法。平时使用浏览器一般都是获取资源，就是进行GET。有时也会进行登录注册，这时会向服务器发送资源，就是进行POST!那么浏览器是如何进行呢？
我们可以在服务器中加入打印客户端请求方法，这样我们可以看到：
在这里插入图片描述
可以看到只要是获取资源都是使用的GET方法！

3.2 postman工具进行请求

那我们可以进行GET方法了，怎么进行POST方法呢？可以使用postman这个工具：

Postman提供了一个直观的界面来构建HTTP请求，包括设置请求头、请求体、认证等。
Postman允许用户发送各种HTTP请求（如GET, POST, PUT, DELETE等）到API端点，并检查响应。它支持测试脚本，可以自动验证响应数据。

我们通过postman快速创建http请求，使用POST方法发送。
在这里插入图片描述
这样服务器就得到了POST方法的请求。

GET方法不光可以获取数据，也可以向服务器发送数据。POST方法也可以向服务器推送数据！
我们可以在postman中加入两个键值对：
在这里插入图片描述
这样我们再次请求时，就会发现我们可以通过url向服务器进行传参了！

我们在使用POST方法试一试，POST方法需要再请求的正文中加入参数：
在这里插入图片描述
这样服务器会得到一个请求，这个请求正文中包含了传入的参数！

总结：

GET方法一般用来获取静态资源，也可以通过URL向服务器传递参数。
POST方法可以通过http请求的正文来进行参数的传递。
URL传参，参数的体量一定不大；正文传参，参数的体量可以很大！

3.3 处理GET和POST参数

但是在用户的实际使用中，用户不可能像POSTMAN一样可以手动选择请求方法，那么实际应用中，是通过前端的form表单完成GET和POST请求！

    <div>
        <!-- 默认就是GET -->
        <form action="/login" method="POST">
            用户名: <input type="text" name="username" value="."><br>
            密码: <input type="password" name="userpasswd" value=""><br>
            <input type="submit" value="提交">
        </form>
    </div>

这里最后使用POST方法，因为使用GET方法，会将参数加入到URL中，这样其他人可以就能够看到用户和密码了，这样可不行！
在这里插入图片描述
那么服务器如何处理参数呢？这个action="/login" 又是什么含义呢？

当使用POST方法时，参数是写在正文中的，那么直接直接按照规则进行解析就可以了！

如果使用GET方法，参数是加在URL中的。如果不做处理，会影响我们后续的很多操作，所以需要对URL进行处理！将真正的URL提取出来，并在正文中储存参数！

    // 解析参数 --- 忽略大小写进行比较
    if (strcasecmp(_method.c_str(), "GET") == 0)
    {
        //寻找 ？
        auto pos = _url.find(arg_sep);
        //包含？说明带参数
        if(pos != std::string::npos) 
        {
            _req_body_text = _url.substr(pos + arg_sep.size());
            _url.resize(pos);
        }
    }

这样不管是使用的什么方法传递的参数，我们都可以通过正文中获取参数了！

接下来我们来看action="/login"，这个资源我们并不存在啊？这个action需要怎么处理呢？

我们在httpserver中加入一系列的服务名称与服务函数的哈希对应。

using func_t = std::function<HttpResponse(HttpRequest)>;

std::unordered_map<std::string , func_t> server_list;
    void InsertService(const std::string servicename , func_t f)
    {
    	//加入网络根目录！
        std::string s = prefixpath + servicename;
        _server_list[s] = f;
    }

那么对于"/login"我们可以插入一个：

hserver.InsertService("/login" , login);

那么服务器可以在处理请求之后，进行特殊处理。识别出来action是"/login"时，就可以去执行func_t函数，然后可以返回对应的应答！

        if (hreq.Path() == "wwwroot/redir")
        {
            // 进行重定向
            LOG(DEBUG, "进行重定向！！！\n");
			//...
        }
        else if (!hreq.GetRequestBody().empty())
        {
            if (IsServiceExists(hreq.Path()))
            {
                resp = _server_list[hreq.Path()](hreq);
            }
        }

这样就实现了对action的处理！！！所以http不光可以处理静态资源，也可以处理函数！

我们就可以设计一个处理login的方法：


HttpResponse Login(HttpRequest &req)
{
    HttpResponse resp;
    std::cout << "外部已经拿到了参数了: " << std::endl;
    req.GetRequestBody();
    std::cout << "####################### " << std::endl;
    resp.AddCode(200, "OK");
    resp.AddBody("<html><h1>result done!</h1></html>");

    // username=helloworld&userpasswd=123456
	//可以进行很多种的操作！
    // 1. pipe
    // 2. dup2
    // 3. fork();
    // 4. 其他进程执行 -> exec* -> python, PHP, 甚至是Java！

    return resp;
}