计算机网络笔记、面试八股(二)——HTTP协议

news2024/10/1 5:41:33

本章目录

    • 2. HTTP协议
      • 2.1 HTTP协议简介
      • 2.2 HTTP协议的优点
      • 2.3 HTTP协议的缺点
      • 2.4 HTTP协议属于哪一层
      • 2.5 HTTP通信过程
      • 2.6 常见请求方法
      • 2.7 GET和POST的区别
      • 2.8 请求报文与响应报文
        • 2.8.1 HTTP请求报文
        • 2.8.2 HTTP响应报文
      • 2.9 响应状态码
      • 2.10 HTTP 1.0和1.1的区别
        • 2.10.1 长连接
        • 2.10.2 错误响应码
        • 2.10.3 缓存处理
        • 2.10.4 带宽的优化以及网络连接的使用
      • 2.11 Cookie和Session
        • 2.11.1 Cookie
          • 2.11.1.1 Cookie作用
          • 2.11.1.2 Cookie常见属性
          • 2.11.1.3 Cookie存储类型
          • 2.11.1.4 Cookie的特点
        • 2.11.2 Session
          • 2.11.2.1 Session的特点
        • 2.11.3 Cookie和Session的区别

2. HTTP协议

2.1 HTTP协议简介

HTTP协议,全称超文本传输协议(Hypertext Transfer Protocol),是从WEB服务器传输超文本标记语言(HTML)到本地浏览器的传送协议。

  • 设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法
  • HTTP协议有多个版本,目前广泛使用的是HTTP/1.1版本。
  • HTTP协议是一个无状态协议(stateless)
    • 无状态的理解:服务器不维护任何有关客户端过去所发请求的消息。
    • 有状态协议会更加复杂,因为需要维护状态(即历史信息),而如果客户端或服务器失效,产生的状态会不一致,解决这种不一致的代价更高。
  • HTML是一门语言,全称是超文本标记语言,超文本的意思就是不只是文本,还可以包含图片、链接、音乐甚至程序等非文字元素。
  • 网络协议:是计算机之间为了实现网络通信而达成的一种“约定”或者“规则”,这样不同厂商的生产设备以及不同操作系统组成的计算机之间,都可以实现通信。

2.2 HTTP协议的优点

  • HTTP协议支持客户端/服务端模式,也是一种请求/响应模式的协议。
  • 简单快速:客户端向服务器请求服务时,只需传送请求方法和路径。
    • 请求方法常用的有GET、POST、HEAD
  • 灵活:HTTP允许传输任意类型的数据对象,传输的类型由Content-Type加以标记。
  • 无连接:限制每次连接都只处理一个请求。当服务器处理完请求,并收到客户端的应答之后,就会断开连接(短连接)。
    • 但是这种无连接却不利于客户端和服务器保持会话连接。为了弥补这种不足,产生了两项记录HTTP状态的技术:Cookie和Session。
  • 无状态:指协议对于事务处理没有记忆。若后续处理需要前面的信息,则必须重传。

2.3 HTTP协议的缺点

  • 请求信息明文传输,容易被窃听截取。
  • 数据的完整性未校验,容易被篡改
    • 所谓完整性是指信息的准确度。若无法证明其完整性,通常也就意味着无法判断信息是否准确。换句话说,没有任何办法确认,发出的请求/响应和接收到的请求/响应是前后相同的。
  • 没有验证对方身份,存在冒充危险
    • HTTP协议中的请求和响应不会对通信方进行确认。任何人都可以伪造虚假服务器欺骗用户,实现“钓鱼欺诈”,用户无法察觉。

2.4 HTTP协议属于哪一层

HTTP属于应用层协议,以TCP协议(传输层)作为底层协议(用于识别该连接请求,解封包,一层一层的剥开),默认端口是80(注意是服务器的端口)。

2.5 HTTP通信过程

HTTP通信是指HTTP客户端(即浏览器)通过URL向HTTP服务端(即WEB服务器)发送请求。

  • 服务器在80端口等待客户端请求
  • 浏览器输入URL,经过DNS域名解析为服务器IP
  • 浏览器发送TCP请求,通过三次握手建立和服务器的连接(创建套接字Socket)
    • 浏览器是以随机端口发送的请求,而服务器是以80端口接收的请求
  • 浏览器发送HTTP请求,服务器返回HTTP响应,即交换HTTP消息
  • 客户端将相应得到的HTML代码和资源渲染到前端给用户
  • 关闭TCP连接

2.6 常见请求方法

  • GET:请求指定的页面信息,并返回实体主体。
  • POST:向指定资源提交数据进行处理请求(例如提交表单或者上传文件)
    • 数据被包含在请求体中
    • POST请求可能会导致新的资源建立或已有资源的修改
  • HEAD:类似于GET请求,只不过返回的响应中没有具体的内容,用于获取报头
  • PUT:从客户端向服务器传送的数据取代指定的文档的内容
  • DELETE:请求服务器删除指定的页面

2.7 GET和POST的区别

  • 结构:都包含请求头和请求行,POST多了一个请求正文body。

  • 用途:GET多用来查询,请求参数放在URL中,不会对服务器上的内容产生作用。POST多用来提交,如把账号密码放在body中。

  • 安全性:GET是直接添加在到URL后面的,直接就可以在URL中看到内容,而POST是放在报文内部的,用户无法直接看到,比较安全。

    • GET方式请求的参数会跟在URL后面,以**?来分隔URL和参数,如果有多个参数,那么参数之间使用&**连接
  • 长度限制:GET提交的数据长度是有限制的,因为URL有长度限制,具体的长度限制是由浏览器决定的。而POST没有长度限制。

  • 缓存:GET可以被缓存,而POST不能被缓存

  • 历史:GET参数保存在浏览器历史中,而POST不会。

  • 后退按钮/刷新:GET请求来说,无害。对于POST请求来说,数据会被重新提交(浏览器应该告知用户数据会被重新提交)。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KuLvE3Ct-1677292494577)(计算机网络/image-20220412105554174.png)]

2.8 请求报文与响应报文

2.8.1 HTTP请求报文

请求报文包含三个部分:

  • 请求行

    • 请求行包含请求方法URL协议/版本
  • 请求头

    • 请求头包含许多有关客户端环境和请求正文的有用信息。例如,请求头可以声明浏览器所用的语言,请求正文的长度等。
    • User-Agent:HTTP客户端运行的浏览器类型的详细信息。通过该头部信息,web服务器可以判断到当前HTTP请求的客户端浏览器类别。
    • Accept:指定客户端能够接收的内容类型,内容类型中的先后次序表示客户端接收的先后次序。实例:Accept:text/xml,application/xml,application/xhtml+xml,text/html;q=0.8,image/png,*/*;q=0.5
    • Accept-Language:指定HTTP客户端浏览器用来展示返回信息所优先选择的语言。
    • Accept-Encoding:指定客户端浏览器可以支持的web服务器返回内容压缩编码类型。表示允许服务器在将输出内容发送到客户端以前进行压缩,以节约带宽。而这里设置的就是客户端浏览器所能够支持的返回压缩格式。
    • Accept-Charset:浏览器可以接受的字符编码集。实例:Accept-Charset: gb2312,utf-8;q=0.7,*;q=0.7
    • Content-Type:显示此HTTP请求提交的内容类型。一般只有post提交时才需要设置该属性。实例:Content-type: application/x-www-form-urlencoded;charset:UTF-8
    • Content-Length:表示web服务器返回消息正文的长度
    • Connection:表示是否需要持久连接。
    • cookie:HTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器。
    • Referer:包含一个URL,用户从该URL代表的页面出发访问当前请求的页面
    • Cache-Control:指定请求和响应遵循的缓存机制。
    • Date:消息发送的时间,服务器响应中要包含这个头部,因为缓存在评估响应的新鲜度时要用到。
    • Via:列出从客户端到 OCS 或者相反方向的响应经过了哪些代理服务器,他们用什么协议(和版本)发送的请求。当客户端请求到达第一个代理服务器时,该服务器会在自己发出的请求里面添加 Via 头部,并填上自己的相关信息,当下一个代理服务器 收到第一个代理服务器的请求时,会在自己发出的请求里面复制前一个代理服务器的请求的Via头部,并把自己的相关信息加到后面,以此类推,当 OCS 收到最后一个代理服务器的请求时,检查 Via 头部,就知道该请求所经过的路由。例如:Via:1.0 236-81.D07071953.sina.com.cn:80 (squid/2.6.STABLE13)
  • 请求正文

    • GET请求不包含,POST请求包含
    • 请求正文中可以包含客户提交的查询字符串信息

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-y4iGhHR4-1677292494577)(计算机网络/1460000023940347.webp)]

例子:

POST/sample.jspHTTP/1.1
Accept:image/gif.image/jpeg,*/*
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
Accept-Encoding:gzip,deflate

username=jinqiao&password=1234

**Note:**请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文。这个空行发送回车符和换行符,通知服务器以下不再有请求头。

2.8.2 HTTP响应报文

响应报文包含三个部分:

  • 状态行
    • 状态行由协议版本、数字形式的状态码、及相应的状态描述,各元素之间以空格分隔。
  • 响应头
  • 响应正文
    • 响应正文包含着我们需要的一些具体信息,比如cookie,html,image,后端返回的请求数据等等。
img

**Note:**响应正文和响应头之间有一行空行,表示响应头的信息到空行为止。

2.9 响应状态码

状态码分类常见状态码:

  • 1XX:信息型,服务器收到请求,客户端可继续发送请求

  • 2XX:成功型:服务器成功收到请求,理解并处理

    • 200 OK:客户端请求成功

    • 204 No Content 成功,但不返回任何实体的主体部分

    • 206 Partial Content 成功执行了一个范围(Range)请求

  • 3XX:重定向,服务器要求客户端重定向

    • 301 Moved Permanently 永久性重定向,响应报文的Location首部应该有该资源的新URL
    • 302 Found 临时性重定向,响应报文的Location首部给出的URL用来临时定位资源
    • 303 See Other 请求的资源存在着另一个URI,客户端应使用GET方法定向获取请求的资源
    • 304 Not Modified 服务器内容没有更新,可以直接读取浏览器缓存
  • 4XX:客户端错误,客户端的请求包含语法错误或无法完成请求

    • 400 Bad Request 表示客户端请求有语法错误,不能被服务器所理解
    • 401 Unauthonzed 表示请求未经授权,该状态代码必须与 WWW-Authenticate 报头域一起使用
    • 403 Forbidden 表示服务器收到请求,但是拒绝提供服务,通常会在响应正文中给出不提供服务的原因
    • 404 Not Found 请求的资源不存在,例如,输入了错误的URL

  • 5XX:服务器错误,服务器在处理请求的过程中发生了错误

    • 500 Internel Server Error 表示服务器发生不可预期的错误,导致无法完成客户端的请求
    • 503 Service Unavailable 表示服务器当前不能够处理客户端的请求,在一段时间之后,服务器可能会恢复正常
      • 503 Service Unavailable的原因及如何解决

2.10 HTTP 1.0和1.1的区别

2.10.1 长连接

在HTTP/1.0中,默认使用的是短连接,也就是每次请求都要重新建立一次连接。采用TCP协议保证可靠传输时,每次建立连接和断开连接都需要进行三次握手和四次挥手。如果每次都这样的话,开销比较大,因此从HTTP/1.1起,默认采用长连接。在请求头中的参数为Connection: keep-alive

HTTP/1.1 的持续连接,有非流水线方式和流水线方式 。

  • 流水线方式,是客户在收到 HTTP 的响应报文之前,就能接着发送新的请求报文;
  • 非流水线方式,是客户在收到前一个响应后才能发起下一个请求

2.10.2 错误响应码

在HTTP/1.1中,新增了24个错误状态响应码,如:

  • 409:表示请求的资源与资源的当前状态发生冲突
  • 410:表示服务器上的某个资源被永久性地删除

2.10.3 缓存处理

HTTP/1.0中主要使用请求头中的If-Modified-SinceExpires来作为缓存判断的标准

HTTP/1.1中引入了更多的缓存控制策略,如强缓存和协商缓存,支持断点传输,以及增加了Host字段(使得一个服务器能够用来创建多个Web站点)如Entity tagIf-Unmodified-SinceIf-MatchIf-Node-Match

2.10.4 带宽的优化以及网络连接的使用

HTTP/1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象传送了进来,并且不支持断点续传等功能;

HTTP/1.1中,在请求头引入了range头域,它允许只请求资源的某个部分,即返回码为206(Partial Content),这样方便开发者自由的选择,以便于充分利用带宽和连接。

2.11 Cookie和Session

HTTP是一种无状态的协议,服务端不会保留与客户端通信时的任何状态。这样做的目的也是为了减轻服务端的记忆负担,使得服务端能够快速处理大量的事务,提高效率。

然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,如Cookie。

2.11.1 Cookie

Cookie指的是浏览器里面能够永久存储的一种数据。

Cookie由服务器生成,发送给浏览器并保存在本地的小型文本数据。浏览器下一次访问相同服务器时,会在请求头中携带cookie发送到服务器上。

  1. 首次请求:浏览器第一次发送请求到服务器;
  2. 响应:服务器对浏览器给出响应,创建并通过响应头 Set-Cookie 将 Cookie 发送给浏览器,Cookie的内存为要保存的数据;
  3. 存储:浏览器接收到响应后会将 Cookie 中的数据存储在文件或内存中,并给Cookie一个有效期;
  4. 携带:当浏览器再次向服务器发送请求时,会通过请求头将 Cookie 传递给服务器;
  5. 获取:服务器解析收到的Cookie,然后给出响应。
2.11.1.1 Cookie作用
  1. 服务端识别客户端身份
  2. 记录历史
2.11.1.2 Cookie常见属性

Cookie 是一段不超过 4KB 的小型文本数据,由一个名称(Name)、一个值(Value)和其它几个用于控制 Cookie 有效期、安全性、使用范围的可选属性组成。

2.11.1.3 Cookie存储类型
  1. Session Cookie:会话Cookie是存放在客户端的浏览器内存中的,只在当前会话有效,在用户关闭会话页或者关闭浏览器时就销毁。
  2. Permanent Cookie:持久化Cookie是存放在客户端的硬盘中的,超过过期时间或者用户在网页中点击“注销”等按钮才会失效。
2.11.1.4 Cookie的特点
  1. Cookie只存储在客户端,安全性低,一般用于存储少量的不敏感的信息
  2. Cookie只能存储字符串,想存储其他类型的数据,需要将其转换成字符串
  3. Cookie方便与JS交换数据,方便获取用户信息
  4. Cookie遵循同源策略,不能跨域访问,除非特别部署
  5. 浏览器对单个Cookie大小有限制(4KB),并对统一域名下的Cookie总数量也有限制(20个)
  6. 浏览器可能会禁用Cookie

2.11.2 Session

由于Cookie存储在客户端,安全性低,我们希望登录状态这些数据能存储在服务端,于是就有了Session。

Session,会话,指客户端与服务端进行通信的过程。比如用户在浏览器中点击一个超链接访问Web资源,到关闭该标签页就是一个Session过程。

  1. 客户端第一次请求服务器时,提交用户名和密码等信息进行登录认证,服务器根据客户端提交的信息进行鉴权。鉴权成功后,创建Session对象,用来保存相关数据,如用户角色、登录时间等。
  2. 服务器响应时,将此Session的唯一标识信息SessionID返回给客户端。客户端收到后,将此SessionID存入到Cookie中,同时Cookie记录此SessionID属于哪个域名。
  3. 客户端之后的每次请求,浏览器都会将当前域名下的Cookie信息发送给服务器
  4. 服务器解析Cookie,获取到SessionID,查找与之对应的Session对象。
    • 如果Session对象存在则说明用户已经登录,返回请求数据。
    • 如果Session对象不存在或者已过期,则展示错误信息,并返回登录界面。
2.11.2.1 Session的特点
  1. Sessio是服务端保存数据的一种机制,用户的一些关键信息会保存在Session中
  2. Session可以保存在文件、数据库、内存中
  3. 每个用户对应一个独立的Session,服务端会存储很多Session
  4. 每个Session都有自己唯一的SessionID,用于标识客户端
  5. Session都有过期时间,如果一定时间没更新数据,就会消失。

2.11.3 Cookie和Session的区别

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/370270.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Lecture6 逻辑斯蒂回归(Logistic Regression)

目录 1 常用数据集 1.1 MNIST数据集 1.2 CIFAR-10数据集 2 课堂内容 2.1 回归任务和分类任务的区别 2.2 为什么使用逻辑斯蒂回归 2.3 什么是逻辑斯蒂回归 2.4 Sigmoid函数和饱和函数的概念 2.5 逻辑斯蒂回归模型 2.6 逻辑斯蒂回归损失函数 2.6.1 二分类损失函数 2.…

3-1 图文并茂说明raid0,raid1, raid10, raid01, raid5等原理

文章目录简介RAID类型RAID0RAID1RAID5RAID6RAID10RAID01RAID对比图简介 一、RAID 是什么? RAID ( Redundant Array of Independent Disks )即独立磁盘冗余阵列,简称为「磁盘阵列」,其实就是用多个独立的磁盘组成在一起…

Jenkins第一讲

目录 一、Jenkins 1.1 敏捷开发与持续集成 1.1.1 敏捷开发 1.1.2 持续集成 1.2 持续集成工具 1.2.1 jenkins和hudson 1.2.2 技术组合 1.2.3 部署方式对比 1.3 安装Jenkins 1.3.1 下载Jenkins的war包 1.3.2 开启Jenkins 1.4 Jenkins全局安全配置 1.5 使用Jenkins部…

InfluxDB docker安装与界面的使用

influxdb github主页:https://github.com/influxdata/influxdb chronograf github主页:https://github.com/influxdata/chronograf Docker安装InfluxDB docker run -p 8086:8086 --name influxdb-dev influxdb:latest这里博主安装的是2.2.1版本 然后…

Python学习-----排序问题2.0(sort()函数和sorted()函数)

目录 前言: 1.sort() 函数 示例1:阿斯克码比较 示例2:(设置reverse,由大到小排序) 示例3:基于key排序(传入一个参数) 示例4:key的其他应用 2.sorted() …

平时技术积累很少,面试时又会问很多这个难题怎么破?别慌,没事看看这份Java面试指南,解决你的小烦恼!

前言技术面试是每个程序员都需要去经历的事情,随着行业的发展,新技术的不断迭代,技术面试的难度也越来越高,但是对于大多数程序员来说,工作的主要内容只是去实现各种业务逻辑,涉及的技术难度并不高&#xf…

Allegro如何画Photoplot_Outline操作指导

Allegro如何画Photoplot_Outline操作指导 在用Allegro进行PCB设计的时候,最后进行光绘输出前,Photoplot_Outline是必备一个图形,所有在Photoplot_Outline中的图形将被输出,Photoplot_Outline以外的图形都将不被输出。 如何绘制Photoplot_Outline,具体操作如下 点击Shape点…

视觉人培训团队把它称之为,工业领域人类最伟大的软件创造,它的名字叫Halcon

目前为止,世界上综合能力强大的机器视觉软件,,它的名字叫Halcon。 视觉人培训团队把它称之为,工业领域人类最伟大的软件创造,它的名字叫Halcon。 持续不断更新最新的图像技术,软件综合能力持续提升。 综…

常量和变量——“Python”

各位CSDN的uu们你们好呀,今天,小雅兰的内容是Python的一些基础语法噢,会讲解一些常量和变量的知识点,那么,现在就让我们进入Python的世界吧 常量和表达式 变量和类型 变量是什么 变量的语法 变量的类型 常量和表达式 …

go面向对象思想封装继承多态

go貌似都没有听说过继承,当然这个继承不像c中通过class类的方式去继承,还是通过struct的方式,所以go严格来说不是面向对象编程的语言,c和java才是,不过还是可以基于自身的一些的特性实现面向对象的功能,面向…

TCP 的演化史-byte stream 和 packet

不想写太多代码,我想直接抄一个 TCP sack 实现,参考了 lwIP TCP,很遗憾:TCP: Implement handling received SACKs 无奈不得不自己实现 sack option 的处理。由于 tso/gso/lro/gro,在软件层面难免遇到下面的情况&#…

Java 如何学习?这份5000页Java学习手册值得拥有,适合零基础自学也适合查漏补缺!

学习技巧 在以前大部分人学习都是先去找本书,先看看,再试,要是不懂了在去网上去查,再在继续啃着书本。但现在向书学习和在网上学习这掌握的效果是不同的,要学会用适合自己的学习方式。 目前的学习要是能看进去书本&a…

【5】linux命令每日分享——touch创建文件

大家好,这里是sdust-vrlab,Linux是一种免费使用和自由传播的类UNIX操作系统,Linux的基本思想有两点:一切都是文件;每个文件都有确定的用途;linux涉及到IT行业的方方面面,在我们日常的学习中&…

飞桨 Tensor 介绍

Tensor 介绍 一、Tensor 的概念介绍 飞桨使用张量(Tensor) 来表示神经网络中传递的数据,Tensor 可以理解为多维数组,类似于 Numpy 数组(ndarray) 的概念。与 Numpy 数组相比,Tensor 除了支持运…

C语言 深度剖析数据在内存中的存储

目录数据类型详细介绍整形在内存中的存储:原码,反码,补码大小端字节序介绍及判断浮点型在内存中的存储解析数据类型详细介绍整形:1.为什么char类型也会归类到整形家族当中去呢?字符存储和表示的时候本质上使用的是ASCI…

【华为OD机试模拟题】用 C++ 实现 - 最大相连男生数(2023.Q1)

最近更新的博客 【华为OD机试模拟题】用 C++ 实现 - 货币单位换算(2023.Q1) 【华为OD机试模拟题】用 C++ 实现 - 选座位(2023.Q1) 【华为OD机试模拟题】用 C++ 实现 - 停车场最大距离(2023.Q1) 【华为OD机试模拟题】用 C++ 实现 - 重组字符串(2023.Q1) 【华为OD机试模…

integrationobjects/OPC AE Client ActiveX Crack

使用 OPC AE 客户端 ActiveX 进行快速 OPC 警报和事件客户端编程! OPC AE Client ActiveX包括多个 OPC ActiveX 控件,可以轻松嵌入到最流行的 OLE 容器中。这允许用户与任何 OPC AE 服务器连接并实时检索警报和事件。 这种易于使用的 OPC AE ActiveX 简化…

论文笔记|固定效应的解释和使用

DeHaan E. Using and interpreting fixed effects models[J]. Available at SSRN 3699777, 2021. 虽然固定效应在金融经济学研究中无处不在,但许多研究人员对作用的了解有限。这篇论文解释了固定效应如何消除遗漏变量偏差并影响标准误差,并讨论了使用固…

【C语言进阶】文件的顺序读写、随机读写、文本文件和二进制文件、文件读取结束的判定以及文件缓冲区相关知识

​ ​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:C语言进阶 🎯长路漫漫浩浩,万事皆有期待 文章目录1.文件操作1.1 概述…

优思学院:《改变世界的机器・精益生产之道》是什么著作?

《改变世界的机器》(The Machine That Changed the World)是一本经典的商业管理书籍,由詹姆斯P温斯顿(James P. Womack)、丹尼尔T琼斯(Daniel T. Jones)和丹尼尔罗斯(Daniel Roos&am…