零宽字符就是零宽度字符是一种不可见,不可打印的字符。它们主要用于调整字符的显示格式。
常见的零宽字符有:
使用零宽字符给信息加密:
通过零宽字符来加密文本,我们需要先将文本转成二进制的形式即只包含0
和1
,并使用空格将每个字符隔开,然后任选3个零宽字符分别用来表示“0
”,“1
”,“空格
”,然后将所有的字符连接起来即可完成信息加密,在得到加密字符串后,我们还可以选择将其隐藏于正常的字符串中,最终的代码实现如下:
const encCharactors = ['\u200b', '\u200c', '\u200d'];
function encode(hiddenTxt = '', normalTxt = '') {
const encodeTxt = hiddenTxt
.split('')
.map(char => char.charCodeAt(0).toString(2))
.join(' ')
.split('')
.map(binary => {
switch (binary) {
case '0':
return encCharactors[0];
case '1':
return encCharactors[1];
default:
return encCharactors[2];
}
})
.join('');
if (normalTxt.length) {
return `${normalTxt[0]}${encodeTxt}${normalTxt.slice(1)}`;
}
return encodeTxt;
}
其中encCharactors
数组定义的每一项分别用于替换“0
”,“1
”,“空格
”,这个可以自己的需求选择任意的零宽字符,使用方式如下:
encode('I love you!', '你好呀');
在上面的代码中,我们将“I love you”隐藏到“你好呀”中,最终只显示“你好呀”。
解密:
对于加密文本的解析我们只需要反向执行加密的步骤即可,最终的实现代码如下:
function decode(txt) {
return txt.replace(/[^\u200b-\u200f\ufeff\u202a-\u202e]/g, '')
.split('')
.map(char => {
switch (char) {
case encCharactors[0]:
return '0';
case encCharactors[1]:
return '1';
default:
return ' ';
}
})
.join('')
.split(' ')
.map(binary => String.fromCharCode(parseInt(binary, 2)))
.join('');
}
在函数的开始我们使用正则/[^\u200b-\u200f\ufeff\u202a-\u202e]/g
过滤了所有的非零宽字符,然后再执行解密步骤,使用方式如下:
decode('你好呀');
零宽字符的应用
- 版权保护:将使用零宽度字符加密的文本插入到文章中,当别人非法复制我们的文章时,我们可以解密其中隐藏的版权信息来保护合法权益。
- 数据防爬:将零宽度字符插入文本中,干扰关键字匹配,爬虫获取的带零宽度字符的数据会影响它对数据的分析,但不影响用户阅读数据。
- 私密传递:将使用零宽度字符加密的文本插入到文本中,复制并通过微信等社交工具发送给对方,对方只有通过专用程序解密文本才能提取其中的信息,达到私密传递的效果。