标准ASC||字符集:
- ASC||:美国信息交换标准代码,包括了英文、数字等
- 标准ASC||使用一个字节存储一个字符,首位是0,总供可以表示128个字符
GBK(汉字内码扩展规范,国标)
- 汉字编码字符集,包含了2w多个汉字等字符。GBK中一个中文字符编码成两个字节的形式存储
- GBK兼容了ASC||字符集,规定了第一个字符必须是1
Unicode字符集(统一码,也叫万国码):Unicode是国际组织制定的,可以容纳世界上所有文字、符号的字符集。
UTF-32:4个字节表示一个字符,缺点就是很奢侈,占存储空间,通信效率低。
UTF-8:是Unicode字符集的一种编码方案,共分四个长度区:1个字节、2个字节、3个字节、4个字节;英文字符、数字占用1个字节(兼容ASC||编码),汉字字符占用3个字节
它的编码规则就是占用两个字节的第一个字节前三位就是110,第二个字节的前两位就是10;其他字节数以此类推。
base64/32/16编码:首先将字符按照特定SC||码写成二进制形式,然后将其分为6/5/4位为一个字节,前面补0;转换为十进制后再对照编码表转化为字符。
url编码就是在对应字符的ASC||码转成十六进制,然后再前面加上%。