python~http的请求参数中携带map

news2025/2/24 13:38:50

背景

调试 http GET请求的 map 参数,链路携带参数一直有问题,最终采用如下方式携带map 解决

user={"demo":"true","info":"王者"}

url encode之后的效果如下所示

user=%7B%22demo%22:%22true%22,%22info%22:%22%E7%8E%8B%E8%80%85%22%7D

最终http的url如下:

http://www.demo.com?user=%7B%22demo%22:%22true%22,%22info%22:%22%E7%8E%8B%E8%80%85%22%7D

代码

方式一

tmp = {"demo":"true","info":"王者"}
json_str = json.dumps(tmp)
encoded_str = urllib.parse.quote(json_str)
url += '&user=%s' % encoded_str

方式二

tmp = {"demo":"true","info":"王者"}
params['user'] = json.dumps(tmp)
r = requests.get(url, headers=headers, params=params, timeout=2)

urllib.parse.quote

URL 中,某些字符具有特殊含义
例如 / 用于分隔 URL 的不同部分,? 用于标识查询字符串的起始,& 用于分隔查询字符串中的不同参数等

当需要在 URL 里包含可能与这些特殊字符冲突的字符(像空格、中文、?&=等特殊符号等)时,就必须对这些字符进行 url 编码,以保证 URL 的正确性和完整性
urllib.parse.quote 函数的作用就是把字符串里的特殊字符转换为符合 URL 规范的编码形式

urllib.parse.quote 函数采用的是百分号编码(Percent-encoding)规则,也称作 URL 编码。在此编码规则下,每个特殊字符会被替换成 % 后面跟着两个十六进制数字,这两个数字代表该字符的 ASCII 码值。比如,空格会被编码为 %20,中文等非 ASCII 字符会先转化为 UTF-8 字节序列,然后每个字节再进行百分号编码

urllib.parse.quote(string, safe='/', encoding=None, errors=None)

string:
这是必需参数,指的是需要进行 URL 编码的字符串

safe:
可选,指定哪些字符不需要进行编码,默认值为 /,意味着 / 字符不会被编码
可以根据实际需求修改这个参数,例如 safe=‘’ 表示对所有字符都进行编码

encoding:
可选,指定字符串的编码方式,默认使用 UTF - 8 编码

errors:
可选,指定编码错误的处理方式,默认值为 ‘strict’,表示遇到编码错误时会抛出异常

示例

import urllib.parse

# 包含特殊字符和中文的字符串
string_to_encode = "你好, world! & / ? ="

# 进行 URL 编码
encoded_string = urllib.parse.quote(string_to_encode)

print(encoded_string)

效果

%E4%BD%A0%E5%A5%BD%2C%20world%21%20%26%20/%20%3F%20%3D

编码学习

百分号编码(Percent-encoding)也称为 URL 编码,它将非 ASCII 字符先转换为 UTF-8 字节序列,然后每个字节再用 % 加上对应的两位十六进制数来表示。

如何将汉字 “我” 转换为 %E6%88%91
字符编码为 UTF-8 字节序列:在 UTF-8 编码中,不同的字符会被编码为不同长度的字节序列。像汉字通常会被编码为 3 个字节。“我” 这个字在 UTF-8 编码下对应的字节序列是 0xE6 0x88 0x91
转换为百分号编码形式:把每个字节转换为 % 加上对应的两位十六进制数。
例如,字节 0xE6 转换为 %E6,字节 0x88 转换为 %88,字节 0x91 转换为 %91。最终 “我” 就被编码为 %E6%88%91

cat demo.py 
# coding: utf-8

# 定义要编码的字符
char = "我"

# 对字符进行 UTF-8 编码,得到字节序列
utf8_bytes = char.encode('utf-8')

# 将字节序列转换为百分号编码形式
percent_encoded = ''.join(f'%{byte:02X}' for byte in utf8_bytes)

# %E6%88%91
print(percent_encoded)

url编码时,为什么有些编码是把空格编码为+,有些则编码为%20

主要取决于使用的编码规范和具体场景

历史背景与规范差异

+ 编码(application/x-www-form-urlencoded)

表单提交规范:在 HTML 表单使用 POST 方法提交数据时,如果表单的 enctype 属性设置为 application/x-www-form-urlencoded(这是表单提交的默认编码类型),空格会被编码为 +。这个规范源自早期的互联网实践,是为了在传输数据时能够更紧凑地表示空格,因为 +%20 占用的字符更少

相关标准:这种编码方式在 HTML 表单数据处理和一些老的 CGI(Common Gateway Interface)程序中广泛使用。例如,当在一个 HTML 表单中输入包含空格的内容并提交时,服务器端接收到的数据里空格就会以 + 的形式呈现。

%20 编码(通用 URL 编码)

RFC 3986 标准:根据互联网工程任务组(IETF)发布的 RFC 3986 标准,在通用的 URL 编码中,空格应该被编码为 %20。这个标准定义了统一的 URI(Uniform Resource Identifier)语法和编码规则,适用于各种类型的 URL,包括路径、查询参数等。
通用性和兼容性:%20 编码更具通用性和兼容性,因为它遵循了标准的百分号编码规则,可以确保在不同的系统和应用程序中正确解析。在大多数现代的 HTTP 请求库和工具中,默认使用 %20 来编码空格。

不同编程语言和库的处理方式

使用 + 编码的情况

Python 的 urllib.urlencode(Python 2):
在 Python 2 的 urllib 模块中,urlencode 函数默认将空格编码为 +,这是为了与 application/x-www-form-urlencoded 规范保持一致

# coding: utf-8

import urllib

params = {'key': 'hello world'}
encoded_params = urllib.urlencode(params)

# 输出: key=hello+world
print encoded_params

使用 %20 编码的情况

Python 的 urllib.parse.quote(Python 3):
在 Python 3 的 urllib.parse 模块中,quote 函数遵循 RFC 3986 标准,将空格编码为 %20

# coding: utf-8

import urllib.parse

string = 'hello world'
encoded_string = urllib.parse.quote(string)

# 输出: hello%20world
print(encoded_string)

requests处理时的 params 默认做法

# coding: utf-8

import requests

params = {'key': 'hello world'}
resp = requests.get('http://example.com', params=params)

# http://example.com/?key=hello+world
print(resp.url)
# <Response [200]>
print(resp)

示例

# coding: utf-8

import json
import requests

user= {
    "demo": "true",
    "info": "王者"
}
# {'user': '{"demo": "true", "info": "\\u738b\\u8005"}'} map以这种方式json化有空格
user_str = json.dumps(user)
params = {'user': user_str}
response = requests.get('http://example.com', params=params)

# http://example.com/?user=%7B%22demo%22%3A+%22true%22%2C+%22info%22%3A+%22%5Cu738b%5Cu8005%22%7D
print(response.url)
# <Response [200]>
print(response)

手动挨个编码

# coding: utf-8

import requests
import urllib.parse

# 定义参数
original_params = {
    'key': 'hello world'
}

# 手动编码参数值
encoded_params = {key: urllib.parse.quote(value) for key, value in original_params.items()}

url = 'http://httpbin.org/get'
response = requests.get(url, params=encoded_params)

# http://httpbin.org/get?key=hello%2520world
print(response.url)

编码过度了,编码了两遍

使用%20

# coding: utf-8
import requests
import urllib.parse

# 定义参数
original_params = {
    'key': 'hello world'
}

# 手动编码参数值并构建参数字符串
param_list = []
for key, value in original_params.items():
    encoded_value = urllib.parse.quote(value)
    param_list.append(f"{key}={encoded_value}")
param_string = '&'.join(param_list)

base_url = 'http://httpbin.org/get'
full_url = f"{base_url}?{param_string}"

# http://httpbin.org/get?key=hello%20world
response = requests.get(full_url)
print(response.url)

总结

空格编码为 + 主要用于 HTML 表单提交和一些遵循 application/x-www-form-urlencoded 规范的场景
空格编码为 %20 遵循 RFC 3986 标准,适用于通用的 URL 编码,具有更好的通用性和兼容性

在实际应用中,需要根据具体的需求和场景选择合适的编码方式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2304417.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网页版的俄罗斯方块

1、新建一个txt文件 2、打开后将代码复制进去保存 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>俄…

创建虚拟环境以及配置对应的项目依赖

文章目录 首先创建一个虚拟环境&#xff0c;创建一个名字为myenv,并且版本为xxx的虚拟环境 conda create --name myenv pythonxxx激活虚拟环境 conda activate myenv下载所需的依赖&#xff0c;如果有requirements.txt文件 pip install -r requirements.txt容易出现的错误&a…

网络安全第三次练习

一、实验拓扑 二、实验要求 配置真实DNS服务信息&#xff0c;创建虚拟服务&#xff0c;配置DNS透明代理功能 三、需求分析 1.创建用户并配置认证策略 2.安全策略划分接口 3.ip与策略配置 四、实验步骤 1.划分安全策略接口 2.创建用户并进行策略认证 3.配置安全策略 4.NAT配…

写大论文的word版本格式整理,实现自动生成目录、参考文献序号、公式序号、图表序号

前情提要&#xff1a;最近开始写大论文&#xff0c;发现由于内容很多导致用老方法一个一个改的话超级麻烦&#xff0c;需要批量自动化处理&#xff0c;尤其是序号&#xff0c;在不断有增添删减的情况时序号手动调整很慢也容易出错&#xff0c;所以搞一个格式总结&#xff0c;记…

STM32——HAL库开发笔记22(定时器3—呼吸灯实验)(参考来源:b站铁头山羊)

本文利用前几节所学知识来实现一个呼吸灯实验&#xff1a;两颗led灯交替呼吸。 一、STM32CubeMX配置 step1&#xff1a;配置调试接口 step2&#xff1a;配置定时器 定时器1位于APB2总线上&#xff0c;如上图所示。 step3&#xff1a;配置时基单元 按照下图配置 时钟来源配置…

玩转 Java 与 Python 交互,JEP 库来助力

文章目录 玩转 Java 与 Python 交互&#xff0c;JEP 库来助力一、背景介绍二、JEP 库是什么&#xff1f;三、如何安装 JEP 库&#xff1f;四、JEP 库的简单使用方法五、JEP 库的实际应用场景场景 1&#xff1a;数据处理场景 2&#xff1a;机器学习场景 3&#xff1a;科学计算场…

【单片机毕业设计14-基于stm32c8t6的智能宠物养护舱系统设计】

【单片机毕业设计14-基于stm32c8t6的智能宠物养护舱系统设计】 前言一、功能介绍二、硬件部分三、软件部分总结 前言 &#x1f525;这里是小殷学长&#xff0c;单片机毕业设计篇14-基于stm32c8t6的智能宠物养护舱系统设计 &#x1f9ff;创作不易&#xff0c;拒绝白嫖可私 一、功…

DevEco Studio常用快捷键以及如何跟AndroidStudio的保持同步

DevEco Studio快捷键 DevEco Studio是华为推出的用于开发HarmonyOS应用的集成开发环境&#xff0c;它提供了丰富的快捷键以提高开发效率&#xff0c;以下为你详细介绍不同操作场景下的常用快捷键&#xff1a; 通用操作快捷键 操作描述Windows/Linux 快捷键Mac 快捷键打开设置窗…

[Windows] 全国油价实时查询,可具体到城市

[Windows] 全国油价实时查询&#xff0c;可具体到城市 链接&#xff1a;https://pan.xunlei.com/s/VOJnS3aOPeBwGaSvS0O0E1hwA1?pwdx83j# 出于代码练习的目的&#xff0c;调用公共免费api做的py程序&#xff0c;已经一键打包&#xff0c;双击启动即可 使用&#xff1a;选择…

【CSS】---- CSS 变量,实现样式和动画函数复用

1. 前言 本文介绍 CSS 的自定义属性(变量)来实现样式、动画等 CSS 的复用。都是知道在 CSS 和 JS 复用一个很重要的事情,比如 JS 的函数封装,各个设计模式的使用等等,CSS 中样式的复用,同样重要。MDN 使用 CSS 自定义属性(变量):自定义属性(有时候也被称作CSS 变量或…

装修流程图: 装修前准备 → 设计阶段 → 施工阶段 → 安装阶段 → 收尾阶段 → 入住

文章目录 引言I 毛坯房装修的全流程**1. 装修前准备****1.1 确定装修预算****1.2 选择装修方式****1.3 选择装修公司****1.4 办理装修手续****2. 设计阶段****2.1 量房****2.2 设计方案****2.3 确认方案****3. 施工阶段****3.1 主体拆改****3.2 水电改造****3.3 防水工程****3.…

【论文解读】《Training Large Language Models to Reason in a Continuous Latent Space》

论文链接 1. 背景与动机 语言空间与推理的矛盾 目前大多数大语言模型&#xff08;LLMs&#xff09;在解决复杂问题时采用链式思维&#xff08;Chain-of-Thought, CoT&#xff09;方法&#xff0c;即利用自然语言逐步推导出答案。然而&#xff0c;论文指出&#xff1a; 自然语言…

深度剖析 C 语言函数递归:原理、应用与优化

在 C 语言的函数世界里&#xff0c;递归是一个独特且强大的概念。它不仅仅是函数调用自身这么简单&#xff0c;背后还蕴含着丰富的思想和广泛的应用。今天&#xff0c;让我们跟随这份课件&#xff0c;深入探索函数递归的奥秘。 一、递归基础&#xff1a;概念与思想 递归是一种…

goredis常见基础命令

基本操作 //删除键 exists,err: rdb.Exists(ctx,"key").Result() if err!nil{panic(err) } if exists>0{err rdb.Del(ctx,"key").Err()if err!nil{panic(err)} }string类型 //设置一个键值对 //0表示没有过期时间 err:rdb.Set(ctx,"key1",…

【Linux网络】序列化、守护进程、应用层协议HTTP、Cookie和Session

⭐️个人主页&#xff1a;小羊 ⭐️所属专栏&#xff1a;Linux 很荣幸您能阅读我的文章&#xff0c;诚请评论指点&#xff0c;欢迎欢迎 ~ 目录 1、序列化和反序列化2、守护进程2.1 什么是进程组&#xff1f;2.2 什么是会话&#xff1f; 3、应用层协议HTTP3.1 HTTP协议3.2 HT…

system verilog的流操作符

流操作符&#xff0c;有分为操作对象是一整个数组和单独的数据两种&#xff0c;例如bit [7:0] a[4]和bit [31:0] b&#xff0c;前者操作对象是数组&#xff0c;后者是单独一个较大位宽的数。 流操作符有<<和>>&#xff0c;代表从右向左打包和从左向右打包。 打包的…

LLM2CLIP论文学习笔记:强大的语言模型解锁更丰富的视觉表征

1. 写在前面 今天分享的一篇论文《LLM2CLIP: P OWERFUL L ANGUAGE M ODEL U NLOCKS R ICHER V ISUAL R EPRESENTATION》&#xff0c; 2024年9月微软和同济大学的一篇paper&#xff0c; 是多模态领域的一篇工作&#xff0c;主要探索了如何将大模型融合到Clip模型里面来进一步提…

计算机毕业设计SpringBoot+Vue.jst网上超市系统(源码+LW文档+PPT+讲解)

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…

HTTP SSE 实现

参考&#xff1a; SSE协议 SSE技术详解&#xff1a;使用 HTTP 做服务端数据推送应用的技术 一句概扩 SSE可理解为&#xff1a;服务端和客户端建立连接之后双方均保持连接&#xff0c;但仅支持服务端向客户端推送数据。推送完毕之后关闭连接&#xff0c;无状态行。 下面是基于…

二分图检测算法以及最大匹配算法(C++)

上一节我们学习了有向图中的最大连通分量. 本节我们来学习二分图. 二分图是一种特殊的图结构, 能够帮助我们高效地解决这些匹配和分配问题. 本文将带你了解二分图的基本概念, 判定方法, 最大匹配算法以及实际应用场景. 环境要求 本文所用样例在Windows 11以及Ubuntu 24.04上面…