Java EE(18)——网络原理——应用层HTTP协议

news2025/4/26 4:05:37

一.初识HTTP协议

HTTP(HyperText Transfer Protocol,超文本传输协议)是用于在客户端(如浏览器)和服务器之间传输超媒体文档(如HTML)的应用层协议。
HTTP协议发展至今发布了多个版本,其中1.0,1.1,2.0是基于传输层TCP协议实现的,3.0是基于UDP实现的

版本关键特性
HTTP/1.0基本请求-响应模型,短连接(每次请求新建TCP连接)
HTTP/1.1持久连接(默认复用TCP连接)
HTTP/2二进制分帧、多路复用、头部压缩、服务器推送(Server Push)
HTTP/3UDP实现、更快的连接建立和传输

目前广泛使用的是1.1和2.0版本,本文最主介绍1.1版本
我们平时打开一个网站就是通过HTTP/HTTPS协议(这个后面介绍)来传输数据的
在这里插入图片描述

二.理解 HTTP 协议的工作过程

当我们在浏览器输入一个网址(URL),浏览器就会根据网址向对应的服务器发起HTTP请求,服务器接收请求后就会返回HTTP响应
在这里插入图片描述
但实际上访问一个网站可能涉及不止一次的HTTP请求和响应,总之HTTP协议的特点是:发送一个请求,返回一次响应

三.HTTP协议格式

3.1 HTTP请求

HTTP请求包含首行,请求头,空行,请求正文四个部分
这个响应只有首行和请求头
在这里插入图片描述

3.1.1URL和方法

在这里插入图片描述

3.1.1.1 URL(唯一资源定位符)

在这里插入图片描述
(1)服务器地址:定位服务器(主机)
(2)服务器端口号:定位到具体的应用程序
(3)文件路径:定位访问的资源。该路径可以对应真实的硬盘文件,也可以是虚拟的文件
(4)query string:针对请求的内容(正文)进行补充说明
在这里插入图片描述
query string 中的键值对是程序员自定义
(5)片段标识符:以#开始,不会发送到服务器,用于定位当前页面的某个部分
在这里插入图片描述

3.1.1.2URL编码(URL Encoding)

URL编码是一种将特殊字符转换为安全传输格式的机制。它确保URL中仅包含合法字符,避免歧义或解析错误
例如:
在这里插入图片描述
URL编码规则

  1. 保留字符必须编码
    以下字符在URL中有特殊用途,若要在非结构位置使用,必须编码:

    ! * ' ( ) ; : @ & = + $ , / ? # [ ] %
    
    • 示例:&%26空格%20?%3F
  2. 非保留字符无需编码
    字母(A-Z, a-z)、数字(0-9)以及- _ . ~直接使用

  3. 非ASCII字符编码
    非英文字符(如中文)先按UTF-8转换为字节,再对每个字节编码:

    • 示例: → UTF-8字节为E5 8C 97%E5%8C%97
  4. 空格的特殊处理
    空格可编码为%20+(仅查询参数中允许+,路径中必须用%20

3.1.1.3方法

在这里插入图片描述
HTTP协议的请求和响应数据绝大部分是使用GET和POST方法,所以主要介绍GET和POST方法
GET:从服务器获取资源(如请求网页,查询数据)
POST:向服务器提交数据(如提交表单,上传文件)
以上GET和POST方法的作用是HTTP标准文档的建议,但HTTP协议是应用层协议,程序员有很大操作空间。如果程序员非要让POST方法获取服务器资源,让GET方法提交数据,实际上是可以这么做的。所以GET和POST方法没有硬性的区分规则,主要看程序员如何使用。不过从使用习惯上来说,GET和POST方法也有区别

(1)GET习惯于将数据放在query string;POST习惯将数据放在body(正文)(2)GET方法一般没有body,因为数据放在query string里了;
   POST一般有body,因为body里面存放着数据(除非这次请求没数据)
(3)GET方法是幂等的,POST方法是非幂等的
   每次输入的内容一致,输出的结果也一致,就叫幂等
   每次输入的内容一致,输出的结果不一致,就叫非幂等
   但是搜购的广告请求使用的GET就不是幂等的,只能说幂等这件事不绝对
(4)因为GET是幂等的,所以支持缓存;而POST不支持

以上区别只是从使用习惯上来划分的,这些区别都不绝对

(5)GET方法的请求可以被浏览器收藏夹收藏,而POST方法的请求不行。这和浏览器的实现有关,原因我可以简略说一下:
浏览器收藏夹收藏的是URL,当用户通过收藏夹来访问的时候本质上是拿到收藏夹中的URL来进行访问。
根据GET方法的使用习惯,GET方法的数据是放在query string里的,所以访问URL可以正常访问到上次的页面
而POST方法的数据一般是存放在body中的,收藏夹不会收藏body,只会收藏URL,这就导致收藏夹收藏的信息不全,那通过收藏夹来访问,可能无法访问到上次的页面

对于GET和POST方法的区别,以下的说法不太严谨
(1)GET方法比POST方法更安全。当登录账号的时候,使用GET方法密码会显示在query string上,能直接被看到;而POST方法会把密码保存在body中,不会被直接看到。所以POST比GET安全
我的看法:放在body中也不安全,一个抓包照样能看到,如果使用HTTPS协议来加密,即便把密码显示在query string中,也是安全的
(2)GET方法传输的数据量上限比POST低
我的看法:这种说法有一定道理。因为在多年前,IE浏览器限制了URL的长度,GET方法是把数据放在query string中的,这可能会限制GET方法的传输上限。但是HTTP标准文档上面明确说了,对于URL长度不做限制。而且在今天,比较长的URL也是挺常见的。所以这个说法在今天不太适用了
(3)GET方法只能携带文本数据,POST方法可以携带二进制数据
我的看法:不全对。
因为GET方法通过query string来携带数据,query string只能携带文本数据。但是可以将二进制数据URL Encoding转码,到达服务器后再URL Decoding还原成二进制数据
虽然POST方法的body可以直接携带二进制数据,但很多时候也使用了URL Encoding来转码

3.1.2请求头

在这里插入图片描述
请求头的格式是键值对,键值对的种类很多,这里介绍几个常见的

(1)Host:表示目的服务器的地址和端口号

在这里插入图片描述
这里的Host没有显示端口号,但其实端口号被设置了一个默认值,和协议的类型有关(HTTP是80,HTTPS是443)。绝大多数情况下,Host中的地址和URL中的地址是一样的。

根据RFC 7230,当请求行中的URL为绝对URI(例如GET http://example.com/index.html HTTP/1.1)时,客户端必须在Host头中设置与URI中完全一致的域名(Host: example.com),且不允许不一致

如果请求行中使用相对路径(例如GET /index.html HTTP/1.1),Host头必须明确指定目标域名(如Host: example.com),此时两者通过不同方式指向同一域名,逻辑上一致

(2)Content-Length:表示body的长度

在这里插入图片描述

用于处理粘包问题。因为HTTP(1.0/1.1/2.0)都是基于TCP协议实现的,TCP传输的单位是字节,当发送方发送多个HTTP请求时,接收方的接收缓冲区就会积累多个数据包,这时候就需要明确包与包之间的边界

(3)Content-Type:表示body中数据的格式

在这里插入图片描述

body的格式很多,甚至可以由程序员自定义,这里介绍三个常见的:
1.application/x-www-form-urlencoded:这是form表单提交的数据格式,此时body的格式就类似于query string
2.application/json:此时body数据为json格式
3.multipart/from-data:通常用于HTML提交图片或者文件

(4)User-Agent表示浏览器或者操作系统的属性,简称UA

在这里插入图片描述
UA 在早年是一个非常有用的字段,网站的开发者可以根据它来检测页面的兼容性。例如 :某程序员发开出的网页使用了某些新特性,通过UA检测用户的设备类型。如果是老设备,那么返回的页面就不显示新特性,保证正常显示;如果是新设备,那就显示新特性,以提高用户体验

(5)Referer:表示这个页面从哪个页面跳转过来的,这个字段很有用

在这里插入图片描述
当在浏览器输入"蛋糕"时,会弹出很多广告,这些广告是蛋糕厂商投射到某个浏览器的。我们点击搜狗的蛋糕广告,搜狗就能赚广告费;点击百度的蛋糕广告,百度就能赚广告费。到时候收取广告费的时候就需要通过Referer字段来判断搜狗的点击量有多少,百度的点击量有多少
注:如果直接在浏览器中输入URL, 或者直接通过收藏夹访问页面时是没有Referer的

(6)Cookie:是一个浏览器本地持久化保存数据的机制(数据写入硬盘)

浏览器上运行的网页能否通过浏览器提供的API来读写硬盘?
理论上是可以的,但是浏览器禁止这么做(因为安全性)。打开一个网站只需要鼠标点一下,如果打开的是一个黑客开发的恶意网站,此时黑客通过网页来读写你的硬盘(删除重要的文件/资料),那就麻烦了,所以浏览器禁止网页直接读写硬盘。
但是某些情况下确实需要再浏览器本地长期保存部分信息(比如当前登录的用户的身份信息),所以就引入了Cookie。Cookie能够有限度的存储一些数据,但不能直接访问文件系统
Cookie的结构:Cookie通过键值对来存储字符串。键值对之间使用分号分割,键和值之间使用等号分割
在这里插入图片描述
Cookie的发送和设置
在这里插入图片描述

3.2 HTTP响应

HTTP请求包含首行,响应头,空行,响应正文四个部分
在这里插入图片描述

3.2.1状态码

在这里插入图片描述
作用:响应状态码用于表示客户端HTTP请求的结果,由三位数字组成

状态码大全

在这里插入图片描述
这里介绍几种常见的状态码:
(1) 200 OK:请求成功
(2) 404 Not Found:请求的资源没找到(URL中的路径不存在)
(3) 403 Forbidden:请求的资源没有权限访问/权限不够
(4) 405 Method Not Allowed:请求的方法对资源不被允许(比如服务器只允许GET方法,你发的请求使用的是POST方法)
(5) 500 Internal Server Error:服务器内部错误(服务器挂了)
(6) 504 Gateway Timeout:访问服务器超时(可能是服务器挂了/负载较大导致处理单条请求的时间过长,也可能是网挂了)
(7) 302 Move temporarily(临时重定向):临时重定向表示请求的资源暂时位于不同的URI下。由于是临时的,客户端在之后的请求中仍应继续使用原有的URI。例如,网站在进行维护时,可以使用302重定向到维护页面
(8) 301 Moved Permanently(永久重定向):永久重定向表示请求的资源已经被永久地移动到新的URI。搜索引擎会更新其索引,将旧URL替换为新URL。适用于那些你知道资源已经永久移动到新的位置

3.2.2响应头

请求头和响应头的数据格式都差不多,但是响应头的Content-Type和请求头有所不同,这里就简单介绍一下

  1.  text/html:表示数据格式是 HTML
    
  2.  text/css:表示数据格式是 CSS
    
  3.  application/javascript:表示数据各式是 JavaScript
    
  4.  application/json:表示数据格式是 JSON
    

四.小结

HTTP协议就先暂时介绍到这里,下篇博文来讲讲HTTPS

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2327563.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

强大而易用的JSON在线处理工具

强大而易用的JSON在线处理工具:程序员的得力助手 在当今的软件开发世界中,JSON(JavaScript Object Notation)已经成为了数据交换的通用语言。无论是前端还是后端开发,我们都经常需要处理、验证和转换JSON数据。今天&a…

Qt笔记----》不同环境程序打包

文章目录 概要1、windows环境下打包qt程序2、linux环境下打包qt程序2.1、程序目录2.2、创建一个空文件夹2.3、添加依赖脚本2.4、打包过程2.4.1、添加程序依赖库2.4.2、添加Qt相关依赖库 概要 qt不同运行环境下打包方式:windows/linux 1、windows环境下打包qt程序 …

企业服务器备份软件,企业服务器备份的方法有哪些?

企业服务器备份需综合考虑数据量、业务连续性要求(RTO/RPO)、合规性及成本等因素。以下是分场景的工具和方法指南: 一、备份软件推荐 1. 80KM备份软件 80KM备份软件可以进行很复杂的备份方式,也可以内网对内网备份、还能内网的…

html5炫酷图片悬停效果实现详解

html5炫酷图片悬停效果实现详解 这里写目录标题 html5炫酷图片悬停效果实现详解项目介绍技术栈核心功能实现1. 页面布局2. 图片容器样式3. 炫酷悬停效果缩放效果倾斜效果模糊效果旋转效果 4. 悬停文字效果5. 性能优化6. 响应式设计 项目亮点总结 项目介绍 本文将详细介绍如何使…

机器学习的一百个概念(5)数据增强

前言 本文隶属于专栏《机器学习的一百个概念》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见[《机器学习的一百个概念》 ima 知识库 知识库广场搜索&…

在MCU工程中优化CPU工作效率的几种方法

在嵌入式系统开发中,优化 CPU 工作效率对于提升系统性能、降低功耗、提高实时性至关重要。Keil 作为主流的嵌入式开发工具,提供了多种优化策略,包括 关键字使用、内存管理、字节对齐、算法优化 等。本文将从多个方面介绍如何在 Keil 工程中优…

美团民宿 mtgsig 小程序 mtgsig1.2 分析

声明 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 逆向分析 cp execjs.compile(open(民…

(done) MIT6.824 Lecture 02 - RPC and Threads

知乎专栏:https://zhuanlan.zhihu.com/p/641105196 原视频:https://www.bilibili.com/video/BV16f4y1z7kn?spm_id_from333.788.videopod.episodes&vd_source7a1a0bc74158c6993c7355c5490fc600&p2 看知乎专栏 一、Why we choose go&#xff1f…

LayaAir3.3.0-beta.3重磅更新!Spine4.2、2D物理、UI系统、TileMap等全面升级!

正式版推出前,说明3.3的功能还没开发完。所以,又一大波更新来了~ 下面对重点更新进行说明。 Spine的重要更新 3.3.0-beta.3版本开始,新增了Spine 4.2 的运行时库,Spine动画上可以支持物理特性了。例如,下图右侧女孩在启…

【AI学习】机器学习算法

1,线性回归模型(Linear Regression):预测连续数值 寻找自变量(解释变量)与因变量(被解释变量)之间的线性关联关系,通过构建线性方程来对数据进行拟合和预测。即两个变量之间是一次函…

【渗透测试】Vulnhub靶机-FSoft Challenges VM: 1-详细通关教程

下载地址:https://www.vulnhub.com/entry/fsoft-challenges-vm-1,402/ 目录 前言 信息收集 目录扫描 wpscan扫描 修改密码 反弹shell 提权 思路总结 前言 开始前注意靶机简介,当第一次开机时会报apache错误,所以要等一分钟后重启才…

【区块链+ 房产建筑】山东省建筑产业互联网平台 | FISCO BCOS 应用案例

山东省建筑产业互联网平台(山东省弘商易盟平台)是基于区块链技术构建的分布式产业互联网平台, 旨在把各企业内部的供应链协同管理系统(包括采购或者SRM 系统, 以及销售或CRM 系统)利用区块链技术链接起来&a…

国家天文台携手阿里云,发布国际首个太阳大模型“金乌”

2025年4月1日,中国科学院国家天文台与阿里云共同宣布推出全球首个太阳物理大模型“金乌”,在太阳活动预测领域实现颠覆性突破——其针对破坏性最强的M5级太阳耀斑预报准确率高达91%,远超传统数值模型,标志着人类对太阳的认知迈入“…

数据结构(5)——栈

目录 前言 一、栈的概念及其结构 二、栈的实现 2.1说明 2.2动态栈结构体定义 2.3初始化 2.4销毁 2.5进(压)栈 2.6检验栈是否为空 2.7弹(出)栈 2.8栈的元素个数 2.9访问栈顶元素 三、运行 总结 前言 栈是一种常见的…

Css径向渐变 - radial-gradient

由background-image: radial-gradient(at 75% 7%, blue 0px, transparent 50%);引出: 一、径向渐变是什么 径向渐变是颜色从一个中心点向外扩散的变化过程。 二、radial-gradient 函数是什么 1、使用语法: background-image: radial-gradient(shape si…

理解激活函数,多个网络层之间如何连接

1. 激活函数如何在两个层之间作用 如果不在两个层之间添加激活函数,模型将无法学习非线性关系,表现出像线性模型一样的局限性。 LeakyReLU(0.2) 是一个激活函数,它的作用是对每一层的输出进行非线性转换。激活函数通常在神经网络中用于增加网…

HTML5 Canvas绘画板项目实战:打造一个功能丰富的在线画板

HTML5 Canvas绘画板项目实战:打造一个功能丰富的在线画板 这里写目录标题 HTML5 Canvas绘画板项目实战:打造一个功能丰富的在线画板项目介绍技术栈核心功能实现1. 画板初始化与工具管理2. 多样化绘画工具3. 事件处理机制 技术要点分析1. Canvas上下文优化…

2025亲测有用 yolov8 pt转onnx转ncnn 部署安卓

参考文章:pt转onnx转ncnn模型(yolov8部署安卓)_best.pt 转ncnn模型-CSDN博客 Yolov8-Ncnn模型部署Android,实现单一图片识别_yolov8转ncnn-CSDN博客 onnx转化为ncnn这条路径现在已经落后了,更多的是通过pnnx转化为nc…

cursor的.cursorrules详解

文章目录 1. 文件位置与作用2. 基本语法规则3. 常用规则类型与示例3.1 忽略文件/目录3.2 限制代码生成范围3.3 自定义补全建议3.4 安全规则 4. 高级用法4.1 条件规则4.2 正则表达式匹配4.3 继承规则 5. 示例文件6. 注意事项 Cursor 是一款基于 AI 的智能代码编辑器,…

MySQL 入门大全:运算符

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,…