Python encode()函数详解,Python编码解码

news2024/11/15 13:46:44

「作者主页」:士别三日wyx
「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者
「推荐专栏」:小白零基础《Python入门到精通》

encode

  • 1、常见编码格式
  • 2、返回的是Bytes类型
  • 3、错误处理方式
  • 4、解码

encode() 可以对字符串进行「编码」,常用来对「中文」字符串进行编码,以解决「乱码」问题。

语法

string.encode( encoding, errors )

参数

  • encodeing :(可选)指定编码,默认 UTF-8
  • errors :(可选)设置错误处理方式,默认

返回值

  • 返回编码后的「新字符串」

实例:对字符串进行GBK编码

str1 = 'hello'
print(str1.encode('gbk'))

输出:

b'hello'

1、常见编码格式

  • ASCLL:美国早期制定的编码规范,只能表示128个字符。
  • GB2312:中国在ASCLL基础上对中文进行扩展,可以表示6763个汉字符号。
  • GBK:对GB2312的进一步扩展(K指扩),收录了21886个汉字符号。
  • GB18030:对GBK再一次扩充,收录了70244个汉字符号。
  • Unicode:字符集,包含了世界上目前所有的符号,全球的所有文字都可以解析,字符是定长的,统一为16位
  • UTF-8:使用最广的一种Unicode的实现方式,每次8个位传输数据;体积太大,国内通常使用GBK。
  • UTF-16:Unicode的另一种实现方式,每次传输16位数据

各个编码实例:

print('hello'.encode('gb2312'))
print('hello'.encode('gbk'))
print('hello'.encode('gb18030'))
print('hello'.encode('utf8'))
print('hello'.encode('utf16'))

输出:

b'hello'
b'hello'
b'hello'
b'hello'
b'\xff\xfeh\x00e\x00l\x00l\x00o\x00'

仔细观察返回结果就会发现,字符串前面都加了个b,接下来我们了解一下这是什么含义。

2、返回的是Bytes类型

encode() 编码后会返回一个「Bytes类型」的结果,而不是「str类型」

str1 = 'hello'
print(type(str1))
print(type(str1.encode()))

输出:

<class 'str'>
<class 'bytes'>

bytes 和 str 都属于字符串类型:

  • str 以Unicode code points形式存储(人认识的形式)
  • bytes 以byte形式存储(机器认识的形式)

bytes 是一个「二进制」序列对象,定义时在字符串前面加上b(英文可以,中文需要先encode)

str1 = b'hello'
print(type(str1))

输出:

<class 'bytes'>

3、错误处理方式

encode() 在编码时,经常会遇到「无法编码」的字符,这时就可以用 errors 设置适当的处理方式:

  • strict:失败时引发错误
  • ignore:忽略无法编码的字符
  • backslashreplace:用反斜杠替换无法编码的字符
  • namereplace:用解释字符的文本替换无法编码的字符
  • replace:用问号替换无法编码的字符
  • xmlcharrefreplace:用xml字符替换字符

如果给「两个参数」,可以自动按顺序复制给参数;如果只给「一个参数」,需要用参数名指定。

print('hello'.encode('gbk', 'strict'))
print('hello'.encode(errors='ignore'))
print('hello'.encode(errors='backslashreplace'))
print('hello'.encode(errors='namereplace'))
print('hello'.encode(errors='replace'))
print('hello'.encode(errors='xmlcharrefreplace'))

4、解码

decode() 会将「bytes类型」转成「str类型」,这意味着它只能解码bytes类型的字符串,解码str类型的字符串会报错 AttributeError: ‘str’ object has no attribute ‘decode’

在这里插入图片描述

bytes类型格式是 b'xxx',如果只有str形式的字符串(比如 '\xe5\xbc\xa0\xe4\xb8\x89'),可以在前面加上b,变成bytes类型,再进行解码

print(b'\xe5\xbc\xa0\xe4\xb8\x89'.decode())

输出:

张三

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/731649.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

5道Mysql面试题

1.什么Mysql的事务&#xff1f;事务的四大特性&#xff1f; Mysql中事务的隔离级别分为四大等级&#xff1a;读未提交&#xff08;READ UNCOMMITTED&#xff09;、读提交 &#xff08;READ COMMITTED&#xff09;、可重复读 &#xff08;REPEATABLE READ&#xff09;、串行化 …

TensorBoard 没有数据

版本 TensorBoard 2.13.0 报错&#xff1a; 打开projector_plugin.py 42行 from tensorboard.compat import notf # noqa: F401 修改为&#xff1a; from tensorboard.compat import tensorflow_stub as tf

Petrozavodsk Winter 2023. Day 1 部分题解

前言&#xff1a;整场的题目质量比较高&#xff0c;虽然之前做过一部分题&#xff0c;但还是被薄纱了 Changing the Sequences 大意&#xff1a; 给定两个数组a,b&#xff0c;长度都为n&#xff0c;元素都介于1-m之间 定义一次操作如下&#xff1a; 构造一个1-m的排列p&…

B - Colorful Stamp

#include<iostream> #include<algorithm> #include<vector> #include<bitset> #include<cmath> #include<set> #include<climits> #include<queue> #include<cstring>//memset头文件 using i64 int64_t; using namespa…

Spring Boot中的会话管理是什么,如何使用

Spring Boot中的会话管理是什么&#xff0c;如何使用 在Web应用程序中&#xff0c;会话是一种存储用户状态信息的机制。Spring Boot提供了会话管理的支持&#xff0c;使得在开发Web应用程序时可以轻松地管理用户的会话信息。本文将介绍Spring Boot中的会话管理是什么以及如何使…

ARM day9 (按键中断控制led亮灭)

key.h #ifndef __KEY_H__ #define __KEY_H__#include "stm32mp1xx_gpio.h" #include "stm32mp1xx_rcc.h" #include "stm32mp1xx_uart.h" #include "stm32mp1xx_exti.h" #include "stm32mp1xx_gic.h"//事件号 #define EXTI_…

特征选择算法 | Matlab实现基于ReliefF特征选择算法的分类数据特征选择 ReliefF

文章目录 效果一览文章概述部分源码参考资料效果一览 文章概述 特征选择算法 | Matlab实现基于ReliefF特征选择算法的分类数据特征选择 ReliefF 部分源码 %--------------------

机器学习基础之《特征工程(2)—特征工程介绍、特征抽取》

一、什么是特征工程 机器学习领域的大神Andrew Ng(吴恩达)老师说“Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learning” is basically feature engineering. ” 注&#xff1a;业界广泛流传&#xff1a;数据和特…

看完这篇 教你玩转渗透测试靶机Vulnhub——Hackable: III

Vulnhub靶机hackableII渗透测试详解 Vulnhub靶机介绍&#xff1a;Vulnhub靶机下载&#xff1a;Vulnhub靶机安装&#xff1a;Vulnhub靶机漏洞详解&#xff1a;①&#xff1a;信息收集&#xff1a;②&#xff1a;端口敲门&#xff1a;③&#xff1a;SSH暴力破解&#xff1a;④&am…

java入门概念个人理解之package与import浅析

java入门概念个人理解之package与import浅析 由于近来学习java&#xff0c;遇到了一些在c上没有的概念&#xff0c;将它记http://录下&#xff0c;以自己复习使用&#xff0c;如有不理解妥之处&#xff0c;望大家批评指导。资料均由网上经过自己整合理解而来&#xff0c;如有侵…

Permission denied (publickey,password)问题的解决办法

[15:29:00.146] Terminal shell path: C:\WINDOWS\System32\cmd.exe [15:29:01.703] > root59.110.21.45: Permission denied (publickey,password). 解决&#xff1a; RSA key 登录方法/home/user/ 目录下建立 .ssh/ 文件夹 cd ~/ mkdir .ssh # 注意.ssh文件夹的权限 ch…

STM32+PWM+输入捕获测频

外部时钟&#xff0c;主频64M 定时器1 通道1发出PWM波 频率1K 定时器2 通道1输入捕获&#xff0c;上升沿触发 串口 /* USER CODE BEGIN 0 */ uint32_t time_up_num0;//上升沿计数 float time_frequency;//频率 /* USER CODE END 0 */ 初始换打开定时器 /* USER CODE BEGIN 2 …

ubuntu系统字体太小调整方法,亲测有效,2分钟解决!

背景&#xff1a;我们在ubuntu系统下写程序时&#xff0c;文件夹及文档的字体太小&#xff0c;看起来很累眼&#xff0c;现将字体调大方法记录如下&#xff0c;只需2分钟即可解决&#xff01;&#xff01; 1、打开终端&#xff0c;安装gnome-tweaks sudo apt install gnome-t…

express框架使用express-generator工具

1.全局安装 npm install -g express-generator 2.检测是否安装成功 express -h 3. 快速创建Express应用程序的工具 express -e express-generator 说明&#xff1a;express-e和express-generator都是用于快速创建Express应用程序的工具。express-e是一个命令行工具&#xff0…

基于深度学习的高精度球场足球检测识别系统(PyTorch+Pyside6+YOLOv5模型)

摘要&#xff1a;基于深度学习的高精度球场足球检测识别系统可用于日常生活中或野外来检测与定位球场足球目标&#xff0c;利用深度学习算法可实现图片、视频、摄像头等方式的球场足球目标检测识别&#xff0c;另外支持结果可视化与图片或视频检测结果的导出。本系统采用YOLOv5…

什么是操作系统

操作系统&#xff08;Operating System&#xff09; 什么是操作系统 操作系统是一组做计算机资源管理的软件的统称。目前常见的操作系统有&#xff1a;Windows系列、Unix系列、Linux系列、OSX系列、Android系列、iOS系列、鸿蒙等 操作系统的定位 操作系统的基本功能 操作系统由…

【报告】从GLM-130B到ChatGLM:大模型预训练与微调学习记录

本文主要是记录《【报告】从GLM-130B到ChatGLM&#xff1a;大模型预训练与微调》此次讲座的汇报内容&#xff0c;如有不适请联系删除即可&#xff0c;总结记录内容纯粹为了后面学习使用方便&#xff0c;文档性质的资料还是要比看视频更加方便的。

将Json结构展平

前言 技术群里面一个哥们在群里提了一个问题&#xff0c;怎么把Json的树形结构展平成一层 在线Json格式化工具 将这个JSON 展平成这样 代码 使用方法 static void Main(string[] args) {//将测试对象转换成测试Jsonvar json JsonConvert.SerializeObject(new{Id 1,Name …

【数据分析 - 基础入门之NumPy⑤】NumPy基本操作 - 二

知识目录 前言一、聚合函数二、矩阵操作2.1 算术运算2.2 线性代数2.3 其他数学操作 三、广播机制3.1 广播的原则3.2 案例 四、排序五、文件操作结语相关导读 前言 大家好&#xff01;本期给大家带来的是【数据分析 - 基础入门之NumPy⑤】NumPy基本操作 - 二&#xff0c;收录于…

t113i不查网线启动,内核[ cut here ]崩溃问题解决

前言 环境介绍&#xff1a; 1.编译环境 Ubuntu 18.04.5 LTS 2.SDK T113-i_v1.0 3.单板 迅龙TLT113-EVM-A1.1-000 自制底板 # 一、现象 插上网线启动&#xff0c;内核打印信息正常 不插网线启动&#xff0c;内核存在CPU崩溃打印[ cut here ] 二、问题根因 根据错误…