先来看一个简单的输入输出
console.log(String.fromCharCode(30328)); //癸
console.log('癸'.charCodeAt()) //30328
来回答一个问题,30328是什么?
ascii?
unicode?
utf-8?
utf-16?
来让我们看看fromCharCode 在MDN上面的解释
UTF-16代码单元序列是什么?来看看官方解释:UTF-16把Unicode字符集的抽象码位映射为16位长的整数(即码元)的序列
说白了就是用两个8位(也就是2字节)来表示一个字符
那我们返回来看30328,他这也不是8位,看起来跟unicode好像也没什么关系,对吧?
那我们可以把癸转成unicode试一下
\u7678就是’癸’这个字符的unicode表示了,他是\u加上16进制的表示法,所以’癸’的16进制就是7678,我们再把7678转成10进制试一试,看看和30328有什么关系
原来30328就是unicode的16进制转成10进制,但是各种官方的解释也不会说明,所以我们从charCodeAt转回字符的时候也是需要10进制的unicode来转
那么其实unicode有4种表示方式
utf-8(1-4字节,可变长度,所以兼容ascii)
utf-16(固定2字节)
utf-32(固定4字节)
unicode字符代号(\u+16进制数)
ascii是8位二进制表示,所以最多指代2^8个字符,也就是256个字符(英文,数字和一些符号,总共127个,剩下的各个国家规定不同,导致出现多种编码格式,就像中国的GBK编码格式),所以没办法表示中文,这才有了unicode的出现,他可以表示全世界的字符,数量足够大,但是网上很多的解释都是互相拷贝,很少有说的清楚,建议大家可以参考计算机的教材,打牢基础,免受折磨!