如果抓取的数据是json数据,那么直接将抓取的数据用json格式输出出来就行了。如下:
response = requests.get(url, headers=headers).json()
那么大家遇到如下的unicode字符串的是如何解决的呢?如下图所示:
相信大家遇到这种一定会抓狂吧,费了好大的力气去抓取数据,结果抓取到的数据是这个样子的,当然,大家此时在解码的时候想到了用别的方式,比如在decode这个里面会加各种编码方式,以不同的编码方式解码出来,如下:
response = requests.get(url, headers=headers).content.decode("xxxx") # xxx为编码方式utf-8、gbk等
然后看看打印结果:
这里我们发现用一般常用的什么utf-8、gbk等,还是无法得到我们想要的结果。
那么该怎么办呢?看看下面的代码
response = requests.get(url, headers=self.headers).content.decode('unicode-escape')
这里会发现decode中多了一个unicode-escape,没错,这个就是今天的重点,只需要用这个就能得到我们想要的结果,
看看打印结果:
这样就成功的拿到了我们想要的结果。
所以我们在遇到decode中加入unicode-escape即可。
欢迎关注公众号:时光python之旅 (欢迎关注我,在这里你能学到更多的知识)