HttpServlet
- 一、什么是协议?
- 什么是HTTP协议?
- 二、HTTP的请求协议(B -- > S)
- 1. HTTP的请求协议包括4部分(记住)
- 2. HTTP请求协议的具体报文:GET请求
- 3. HTTP请求协议的具体报文:POST请求
- 4. 解析请求协议的4部分
- 三、HTTP的响应协议(S --> B)
- 1. HTTP的响应协议包括:4部分【记住】
- 2. HTTP响应协议的具体报文
- 3. 解析响应协议的4部分
- 四、怎么向服务器发送GET请求,怎么向服务器发送POST请求?
- 五、GET请求和POST请求有什么区别?【重点!!!】
- 六、GET请求和POST请求如何选择,什么时候使用GET请求,什么时候使用POST请求?
- 小结
- 七、HttpServlet源码分析
- 问题一
- 问题二
- 小结
一、什么是协议?
- 协议实际上是某些人,或者某些组织提前制定好的一套规范,大家都按照这个规范来,这样可以做到沟通无障碍。
- 协议就是一套规范,就是一套标准。由其他人或其他组织来负责制定的。
- 比如:我说的话你能听懂,你说的话,我也能听懂,这说明我们之间是有一套规范的,一套协议的,这套协议就是:中国普通话协议。我们都遵守这套协议,我们之间就可以沟通无障碍。
什么是HTTP协议?
- HTTP协议:是W3C制定的一种超文本传输协议。(通信协议:发送消息的模板提前被制定好。)
- W3C:
■ 万维网联盟组织
■ 负责制定标准的:HTTP HTML4.0 HTML5 XML DOM等规范都是W3C制定的。
■ 万维网之父:蒂姆·伯纳斯·李 - 什么是超文本?
■ 超文本说的就是:不是普通文本,比如流媒体:声音、视频、图片等。
■ HTTP协议支持:不但可以传送普通字符串,同样支持传递声音、视频、图片等流媒体信息。 - 这种协议游走在B和S之间。B向S发数据要遵循HTTP协议。S向B发数据同样需要遵循HTTP协议。这样B和S才能解耦合。
- 什么是解耦合?
■ B不依赖S。
■ S也不依赖B。 - B/S表示:B/S结构的系统(浏览器访问WEB服务器的系统)
- 浏览器 向 WEB服务器发送数据,叫做:请求(request)
- WEB服务器 向 浏览器发送数据,叫做:响应(response)
- HTTP协议包括:
■ 请求协议
● 浏览器 向 WEB服务器发送数据的时候,这个发送的数据需要遵循一套标准,这套标准中规定了发送的数据具体格式。
■ 响应协议
● WEB服务器 向 浏览器发送数据的时候,这个发送的数据需要遵循一套标准,这套标准中规定了发送的数据具体格式。 - HTTP协议就是提前制定好的一种消息模板。
■ 不管你是哪个品牌的浏览器,都是这么发。
■ 不管你是哪个品牌的WEB服务器,都是这么发。
■ FF浏览器 可以向 Tomcat发送请求,也可以向Jetty服务器发送请求。浏览器不依赖具体的服务器品牌。
■ WEB服务器也不依赖具体的浏览器品牌。可以是FF浏览器,也可以是Chrome浏览器,可以是IE,都行。
二、HTTP的请求协议(B – > S)
1. HTTP的请求协议包括4部分(记住)
- 请求行
- 请求头
- 空白行
- 请求体
2. HTTP请求协议的具体报文:GET请求
怎么查看的协议内容?
● 使用chrome浏览器:F12。然后找到network,通过这个面板可以查看协议的具体内容。
GET /servlet05/getServlet?username=lucy&userpwd=1111 HTTP/1.1 请求行
Host: 127.0.0.1:8088 请求头
Referer: http://127.0.0.1:8088/servlet05/index.html
Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: same-origin
Sec-Fetch-User: ?1
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36
sec-ch-ua: "Google Chrome";v="107", "Chromium";v="107", "Not=A?Brand";v="24"
sec-ch-ua-mobile: ?0
sec-ch-ua-platform: "Windows"
空白行
请求体
3. HTTP请求协议的具体报文:POST请求
POST /servlet05/postServlet HTTP/1.1 请求行
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9 请求头
Accept-Encoding: gzip, deflate, br
Accept-Language: en-US,en-GB;q=0.9,en-GB-oxendict;q=0.8,en;q=0.7,zh;q=0.6,zh-CN;q=0.5
Cache-Control: max-age=0
Connection: keep-alive
Content-Length: 26
Content-Type: application/x-www-form-urlencoded
Host: 127.0.0.1:8088
Origin: http://127.0.0.1:8088
Referer: http://127.0.0.1:8088/servlet05/index.html
Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: same-origin
Sec-Fetch-User: ?1
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36
sec-ch-ua: "Google Chrome";v="107", "Chromium";v="107", "Not=A?Brand";v="24"
sec-ch-ua-mobile: ?0
sec-ch-ua-platform: "Windows"
空白行
username=lisi&userpwd=123 请求体
4. 解析请求协议的4部分
- 请求行
- 包括三部分:
○ 第一部分:请求方式(7种)
■ get(常用的)
■ post(常用的)
■ delete
■ put
■ head
■ options
■ trace
○ 第二部分:URI
■ 什么是URI? 统一资源标识符。代表网络中某个资源的名字。但是通过URI是无法定位资源的。
■ 什么是URL?统一资源定位符。代表网络中某个资源,同时,通过URL是可以定位到该资源的。
■ URI和URL什么关系,有什么区别?
● URL包括URI
● http://localhost:8088/servlet05/index.html 这是URL。
● /servlet05/index.html 这是URI。
○ 第三部分:HTTP协议版本号
- 请求头
● 请求的主机
● 主机的端口
● 浏览器信息
● 平台信息
● cookie等信息
● … - 空白行
● 空白行是用来区分“请求头”和“请求体” - 请求体
● 向服务器发送的具体数据。
三、HTTP的响应协议(S --> B)
1. HTTP的响应协议包括:4部分【记住】
- 状态行
- 响应头
- 空白行
- 响应体
2. HTTP响应协议的具体报文
怎么查看的协议内容?
● 使用chrome浏览器:F12。然后找到network,通过这个面板可以查看协议的具体内容。
HTTP/1.1 200 ok 状态行
Content-Type: text/html;charset=UTF-8 响应头
Content-Length: 160
Date: Fri, 18 Nov 2022 01:17:45 GMT
Keep-Alive: timeout=20
Connection: keep-alive
空白行
<!doctype html> 响应体
<html>
<head>
<title>from get servlet</title>
</head>
<body>
<h1>from get servlet</h1>
</body>
</html>
3. 解析响应协议的4部分
- 状态行(重要,理解!!!)
三部分组成
- 第一部分:协议版本号(HTTP/1.1)
- 第二部分:状态码(HTTP协议中规定的响应状态号。不同的响应结果对应不同的号码。)
■ 200 表示请求响应成功,正常结束。
■ 404表示访问的资源不存在,通常是因为要么是你路径写错了,要么是路径写对了,但是服务器中对应的资源并没有启动成功。总之404错误是前端错误。
■ 405表示前端发送的请求方式与后端请求的处理方式不一致时发生:
● 比如:前端是POST请求,后端的处理方式按照get方式进行处理时,发生405
● 比如:前端是GET请求,后端的处理方式按照post方式进行处理时,发生405
■ 500表示服务器端的程序出现了异常。一般会认为是服务器端的错误导致的。
■ 以4开始的,一般是浏览器端的错误导致的。
■ 以5开始的,一般是服务器端的错误导致的。 - 第三部分:状态的描述信息
■ ok 表示正常成功结束。
■ not found 表示资源找不到。
- 响应头:
● 响应的内容类型
● 响应的内容长度
● 响应的时间
● … - 空白行:
● 用来分隔“响应头”和“响应体”的。 - 响应体:
● 响应体就是响应的正文,这些内容是一个长的字符串,这个字符串被浏览器渲染,解释并执行,最终展示出效果。
四、怎么向服务器发送GET请求,怎么向服务器发送POST请求?
- 到目前为止,只有一种情况可以发送POST请求:使用form表单,并且form标签中的method属性值为:method=“post”。
- 其他所有情况一律都是get请求:
○ 在浏览器地址栏上直接输入URL,敲回车,属于get请求。
○ 在浏览器上直接点击超链接,属于get请求。
○ 使用form表单提交数据时,form标签中没有写method属性,默认就是get
○ 或者使用form的时候,form标签中method属性值为:method=“get”
○ …
【关键词:method 属性,默认是就是get!】
五、GET请求和POST请求有什么区别?【重点!!!】
- get请求发送数据的时候,数据会挂在URI的后面,并且在URI后面添加一个“?”,"?"后面是数据。这样会导致发送的数据回显在浏览器的地址栏上。(get请求在“请求行”上发送数据)
- post请求发送数据的时候,在请求体当中发送。不会回显到浏览器的地址栏上。也就是说post发送的数据,在浏览器地址栏上看不到。(post在“请求体”当中发送数据)
- 不管你是get请求还是post请求,发送的请求数据格式是完全相同的,只不过位置不同,格式都是统一的:
name=value&name=value&name=value&name=value
name是什么?
○ 以form表单为例:form表单中input标签的name。value是什么?
○ 以form表单为例:form表单中input标签的value。
- get请求只能发送普通的字符串。并且发送的字符串长度有限制,不同的浏览器限制不同。这个没有明确的规范。
- get请求无法发送大数据量。
- post请求可以发送任何类型的数据,包括普通字符串,流媒体等信息:视频、声音、图片。
- post请求可以发送大数据量,理论上没有长度限制。
- get请求在W3C中是这样说的:get请求比较适合从服务器端获取数据。
- post请求在W3C中是这样说的:post请求比较适合向服务器端传送数据。
- get请求是安全的。get请求是绝对安全的。为什么?因为get请求只是为了从服务器上获取数据。不会对服务器造成威胁。(get本身是安全的,你不要用错了。用错了之后又冤枉人家get不安全,你这样不好(太坏了),那是你自己的问题,不是get请求的问题。)
- post请求是危险的。为什么?因为post请求是向服务器提交数据,如果这些数据通过后门的方式进入到服务器当中,服务器是很危险的。另外post是为了提交数据,所以一般情况下拦截请求的时候,大部分会选择拦截(监听)post请求。
- get请求支持缓存。
○ https://n.sinaimg.cn/finance/590/w240h350/20211101/b40c-b425eb67cabc342ff5b9dc018b4b00cc.jpg
○ 任何一个get请求最终的“响应结果”都会被浏览器缓存起来。在浏览器缓存当中:
■ 一个get请求的路径a 对应 一个资源。
■ 一个get请求的路径b 对应 一个资源。
■ 一个get请求的路径c 对应 一个资源。
■ …
○ 实际上,你只要发送get请求,浏览器做的第一件事都是先从本地浏览器缓存中找,找不到的时候才会去服务器上获取。这种缓存机制目的是为了提高用户的体验。
○ 有没有这样一个需求:我们不希望get请求走缓存,怎么办?怎么避免走缓存?我希望每一次这个get请求都去服务器上找资源,我不想从本地浏览器的缓存中取。
■ 只要每一次get请求的请求路径不同即可。
■ https://n.sinaimg.cn/finance/590/w240h350/20211101/7cabc342ff5b9dc018b4b00cc.jpg?t=78978978789789
■ https://n.sinaimg.cn/finance/590/w240h350/20211101/7cabc342ff5b9dc018b4b00cc.jpg?t=789789787897899
■ https://n.sinaimg.cn/finance/590/w240h350/20211101/7cabc342ff5b9dc018b4b00cc.jpg?t=系统毫秒数
■ 怎么解决?可以在路径的后面添加一个每时每刻都在变化的“时间戳”,这样,每一次的请求路径都不一样,浏览器就不走缓存了。【在AJAX会详细讲解,这里指示理论】 - post请求不支持缓存。(POST是用来修改服务器端的资源的。)
○ post请求之后,服务器“响应的结果”不会被浏览器缓存起来。因为这个缓存没有意义。
六、GET请求和POST请求如何选择,什么时候使用GET请求,什么时候使用POST请求?
- 怎么选择GET请求和POST请求呢?衡量标准是什么呢?你这个请求是想获取服务器端的数据,还是想向服务器发送数据。如果你是想从服务器上获取资源,建议使用GET请求,如果你这个请求是为了向服务器提交数据,建议使用POST请求。
- 大部分的form表单提交,都是post方式,因为form表单中要填写大量的数据,这些数据是收集用户的信息,一般是需要传给服务器,服务器将这些数据保存/修改等。
- 如果表单中有敏感信息,还是建议适用post请求,因为get请求会回显敏感信息到浏览器地址栏上。(例如:密码信息)
- 做文件上传,一定是post请求。要传的数据不是普通文本。
- 其他情况都可以使用get请求。
小结
能区分get和post请求的不同之处,以及稍微理解该怎么选择,该用哪个【目前理论原理】,有些知识该记得记!
【到这儿,可以跳转到模板方法设计模式中去了解该设计模式!】
七、HttpServlet源码分析
- HttpServlet类是专门为HTTP协议准备的。比GenericServlet更加适合HTTP协议下的开发。
- HttpServlet在哪个包下?
○ jakarta.servlet.http.HttpServlet - 到目前为止我们接触了servlet规范中哪些接口?
○ jakarta.servlet.Servlet 核心接口(接口)
○ jakarta.servlet.ServletConfig Servlet配置信息接口(接口)
○ jakarta.servlet.ServletContext Servlet上下文接口(接口)
○ jakarta.servlet.ServletRequest Servlet请求接口(接口)
○ jakarta.servlet.ServletResponse Servlet响应接口(接口)
○ jakarta.servlet.ServletException Servlet异常(类)
○ jakarta.servlet.GenericServlet 标准通用的Servlet类(抽象类) - http包下都有哪些类和接口呢?jakarta.servlet.http.*;
○ jakarta.servlet.http.HttpServlet (HTTP协议专用的Servlet类,抽象类)
○ jakarta.servlet.http.HttpServletRequest (HTTP协议专用的请求对象)
○ jakarta.servlet.http.HttpServletResponse (HTTP协议专用的响应对象) - HttpServletRequest对象中封装了什么信息?
○ HttpServletRequest,简称request对象。
○ HttpServletRequest中封装了请求协议的全部内容。
○ Tomcat服务器(WEB服务器)将“请求协议”中的数据全部解析出来,然后将这些数据全部封装到request对象当中了。
○ 也就是说,我们 只要面向HttpServletRequest,就可以获取请求协议中的数据。 - HttpServletResponse对象是专门用来响应HTTP协议到浏览器的。
- 回忆Servlet生命周期?
○ 用户第一次请求
■ Tomcat服务器通过反射机制,调用无参数构造方法。创建Servlet对象。(web.xml文件中配置的Servlet类对应的对象。)
■ Tomcat服务器调用Servlet对象的init方法完成初始化。
■ Tomcat服务器调用Servlet对象的service方法处理请求。
○ 用户第二次请求
■ Tomcat服务器调用Servlet对象的service方法处理请求。
○ 用户第三次请求
■ Tomcat服务器调用Servlet对象的service方法处理请求。
○ …
■ Tomcat服务器调用Servlet对象的service方法处理请求。
○ 服务器关闭
■ Tomcat服务器调用Servlet对象的destroy方法,做销毁之前的准备工作。
■ Tomcat服务器销毁Servlet对象。 - HttpServlet源码分析:【根据生命周期进行分析】
// 第一步:通过无参构造方法创建对象
public class HelloServlet extends HttpServlet {
// 用户第一次请求,创建HelloServlet对象的时候,会执行这个无参数构造方法。
public HelloServlet() {
}
//override 重写 doGet方法
//override 重写 doPost方法
}
// 第二步:调用GenericServlet抽象类的含参数的init方法
public abstract class GenericServlet implements Servlet, ServletConfig,
java.io.Serializable {
// 用户第一次请求的时候,HelloServlet对象(自创)第一次被创建之后,这个init方法会执行。
public void init(ServletConfig config) throws ServletException {
this.config = config;
this.init();
}
// 用户第一次请求的时候,带有参数的init(ServletConfig config)执行之后,会调用执行这个没有参数的init()
public void init() throws ServletException {
// NOOP by default
}
}
// 第三步:调用HttpServlet类的service方法
// HttpServlet模板类【模板方法设计模式:类】。
public abstract class HttpServlet extends GenericServlet {
// 用户发送第一次请求的时候这个service会执行
// 用户发送第N次请求的时候,这个service方法还是会执行。
// 用户只要发送一次请求,这个service方法就会执行一次。
@Override
public void service(ServletRequest req, ServletResponse res)
throws ServletException, IOException {
HttpServletRequest request;
HttpServletResponse response;
try {
// 将ServletRequest和ServletResponse向下转型为带有Http的HttpServletRequest和HttpServletResponse
request = (HttpServletRequest) req;
response = (HttpServletResponse) res;
} catch (ClassCastException e) {
throw new ServletException(lStrings.getString("http.non_http"));
}
// 调用重载的service方法。【那该重载的方法是指哪个呢?下面这个!】
service(request, response);
}
// 这个service方法的两个参数都是带有Http的。
// 这个service是一个模板方法【模板方法设计模式:方法】。
// 在该方法中定义核心算法骨架,具体的实现步骤延迟到子类中去完成。
protected void service(HttpServletRequest req, HttpServletResponse resp)
throws ServletException, IOException {
// 获取请求方式
// 这个请求方式最终可能是:""
// 注意:request.getMethod()方法获取的是请求方式,可能是七种之一:
// GET POST PUT DELETE HEAD OPTIONS TRACE
String method = req.getMethod();
// 如果请求方式是GET请求,则执行doGet方法。
if (method.equals(METHOD_GET)) {
long lastModified = getLastModified(req);
if (lastModified == -1) {
// servlet doesn't support if-modified-since, no reason
// to go through further expensive logic
doGet(req, resp);
} else {
long ifModifiedSince;
try {
ifModifiedSince = req.getDateHeader(HEADER_IFMODSINCE);
} catch (IllegalArgumentException iae) {
// Invalid date header - proceed as if none was set
ifModifiedSince = -1;
}
if (ifModifiedSince < (lastModified / 1000 * 1000)) {
// If the servlet mod time is later, call doGet()
// Round down to the nearest second for a proper compare
// A ifModifiedSince of -1 will always be less
maybeSetLastModified(resp, lastModified);
doGet(req, resp);
} else {
resp.setStatus(HttpServletResponse.SC_NOT_MODIFIED);
}
}
} else if (method.equals(METHOD_HEAD)) {
long lastModified = getLastModified(req);
maybeSetLastModified(resp, lastModified);
doHead(req, resp);
} else if (method.equals(METHOD_POST)) {
// 如果请求方式是POST请求,则执行doPost方法。
doPost(req, resp);
} else if (method.equals(METHOD_PUT)) {
doPut(req, resp);
} else if (method.equals(METHOD_DELETE)) {
doDelete(req, resp);
} else if (method.equals(METHOD_OPTIONS)) {
doOptions(req,resp);
} else if (method.equals(METHOD_TRACE)) {
doTrace(req,resp);
} else {
//
// Note that this means NO servlet supports whatever
// method was requested, anywhere on this server.
//
String errMsg = lStrings.getString("http.method_not_implemented");
Object[] errArgs = new Object[1];
errArgs[0] = method;
errMsg = MessageFormat.format(errMsg, errArgs);
resp.sendError(HttpServletResponse.SC_NOT_IMPLEMENTED, errMsg);
}
}
//get请求
protected void doGet(HttpServletRequest req, HttpServletResponse resp)
throws ServletException, IOException{
// 报405错误
String msg = lStrings.getString("http.method_get_not_supported");
sendMethodNotAllowed(req, resp, msg);
}
//post请求
protected void doPost(HttpServletRequest req, HttpServletResponse resp)
throws ServletException, IOException {
// 报405错误
String msg = lStrings.getString("http.method_post_not_supported");
sendMethodNotAllowed(req, resp, msg);
}
}
问题一
我们编写的HelloServlet直接继承HttpServlet,直接重写HttpServlet类中的service()方法行吗?
- 可以,只不过你享受不到405错误。享受不到HTTP协议专属的东西。【也就是说,如果后端重写doGet方法,而前端发出post请求,此时本应该报405错误,但你直接重写了service()方法,就不会报这个错误】
问题二
通过源码分析:假设前端发送的请求是get请求,后端程序员重写的方法是doPost,那会发生什么呢?反之,一样原因。
重写doPost()方法或doGet()方法:
protected void doPost(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException{
PrintWriter out = response.getWriter();
out.print("<h1>doPost</h1>");
}
protected void doGet(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException{
PrintWriter out = response.getWriter();
out.print("<h1>doGet</h1>");
}
【验证问题结论的代码】
HelloServlet.java:
public class HelloServlet extends HttpServlet {
// 通过无参数构造方法创建对象。
/*public HelloServlet() {
}*/
// 没有提供init方法,那么必然执行父类HttpServlet的init方法。
// HttpServlet类中没有init方法,会继续执行GenericServlet类中的init方法。
// 没有提供service方法。那么必然执行父类HttpServlet类service方法。
/*@Override
protected void service(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException {
response.setContentType("text/html");
PrintWriter out = response.getWriter();
out.print("<h1>hello servlet</h1>");
}*/
// 当前端发送的请求是get请求的时候,我这里重写doGet方法。
/*protected void doGet(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException{
PrintWriter out = response.getWriter();
out.print("<h1>doGet</h1>");
}*/
// 当前端发送的请求是post请求的时候,我这里重写doPost方法。
protected void doPost(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException{
PrintWriter out = response.getWriter();
out.print("<h1>doPost</h1>");
}
}
index.html:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>index page</title>
</head>
<body>
<h1>get请求</h1>
<!--href路径:项目名(比如crm)+ URI-->
<a href="/servlet06/hello">hello(get请求)</a><br>
<h1>post请求</h1>
<!--action路径:项目名(比如crm)+ URI-->
<form action="/servlet06/hello" method="post">
<input type="submit" value="hello">
</form>
</body>
</html>
小结
- 通过以上源代码分析:
假设前端发送的请求是get请求,后端程序员重写的方法是doPost 或者 假设前端发送的请求是post请求,后端程序员重写的方法是doGet
会发生什么呢?
发生405这样的一个错误。
405表示前端的错误,发送的请求方式不对。和服务器不一致。不是服务器需要的请求方式。
通过以上源代码可以知道:只要HttpServlet类中的doGet方法或doPost方法执行了,必然405。
- 怎么避免405的错误呢?
后端重写了doGet方法,前端一定要发get请求。
后端重写了doPost方法,前端一定要发post请求。
这样可以避免405错误。
这种前端到底需要发什么样的请求,其实应该后端说了算。后端让发什么方式,前端就得发什么方式。
- 那如何选择doGet方法还是doPost方法?
有的人,你会看到为了避免405错误,在Servlet类当中,将doGet和doPost方法都进行了重写。
这样,确实可以避免405的发生,但是不建议,405错误还是有用的。该报错的时候就应该让他报错。
如果你要是同时重写了doGet和doPost,那还不如你直接重写service方法好了。这样代码还能少写一点。
- 最终,我还是建议使用HttpServlet类中重写doGet方法或者doPost方法!!!