🧡🧡🧡这篇是关于Python中为什么会出现中文乱码的讲解,欢迎点赞和收藏,你点赞和收藏是我更新的动力🧡🧡🧡
在解释Python中中文乱码的问题之前,我们先对计算机中几个基本单位进行了解一下
文章目录
- 1、基本概念
- 1.1、比特位(Bit)
- 1.2、字节(Byte)
- 1.3、字符(Character)
- 1.4、字符集(Character Set)
- 1.5、字符码(Code Point)
- 1.6、字符编码(Character Encoding)
- 1.7、编码(Encoding)
- 1.8、解码 (Decoding)
- 2、Python中乱码原因
- 3、为什么会有这么多字符编码?
1、基本概念
1.1、比特位(Bit)
比特位是计算机最小的存储单位
通常用0或1来表示比特位的值
1.2、字节(Byte)
字节是计算机中数据存储的基本单元
1Byte = 8Bit
1.3、字符(Character)
字符是一个信息单位
是各种文字和符号的统称
1.4、字符集(Character Set)
字符集是某个范围内字符的集合
不同的字符集规定了不同字符的个数
1.5、字符码(Code Point)
字符集中每个字符的数字编号
1.6、字符编码(Character Encoding)
是将字符集中的字符码映射为字节流的一种具体实现方案
常见的字符编码有:
- ASCII 编码
- UTF-8 编码
- GBK 编码
1.7、编码(Encoding)
编码的过程是将字符转换成字节流
1.8、解码 (Decoding)
解码的过程是将字节流解析为字符
2、Python中乱码原因
在计算机中,进行存储数据,存储的数据看成是文本,计算机存储的最终需求就是让文本存储到存储器中,这个过程涉及到文本和存储器
存储器可以看成是商场的货柜,进行存放物品
在计算机中基本存储单位是字节Byte
最小存储单元是位Bit
字符按照一定方式进行存储,转换为二进制的形式进行存储
如何进行存储字符?
- 将字符转换成数字
- 直接存储数字
我们进行输入的都是一个个字符,字符存储在计算机中需要思考两个问题:
- 按照怎么样的规范把字符转换成数字?
- 按照怎么样的方式存储数字?(是用一个字节还是两个字节?)
3、为什么会有这么多字符编码?
😁😁😁觉得对自己有帮助的小伙伴可以点个赞哦😁😁😁
👉👉👉有误的地方也可以在评论区讨论哦👈👈👈