URL在传输时只能使用ACSII码表示,且ASCII码只有128位,无法存储汉字等字符,因此对于这些非ASCII码字符需要进行编码处理,以保证URL的完整性
Python中urllib.parse
模块提供了两个方法quote
和unquote
可用于URL中的中文编码与解码
以下是一个示例:
from urllib.parse import quote, unquote
# URL编码与解码(中文乱码)
ms = "美食"
# 中文编码
print(quote(ms)) # %E7%BE%8E%E9%A3%9F
# 中文解码
print(unquote("%E7%BE%8E%E9%A3%9F")) # 美食