目录
1 requests.get(url) 的各种属性
1.1 response.text
1 requests.get(url) 的各种属性,也就是response的各种属性
- 接触的requests模块的常用功能:
- 一般把 response = requests.get(url)
requests.get(url)的各种属性
- print(response.text)
- print(response.content.decode()) # 注意这里!
- print(response.url) # 打印响应的url
- print(response.status_code) # 打印响应的状态码
- print(response.request.headers) # 打印响应对象的请求头
- print(response.headers) # 打印响应头
- print(response.request._cookies) # 打印请求携带的cookies
- print(response.cookies) # 打印响应中携带的cookies
2 下面进行测试
#E:\work\FangCloudV2\personal_space\2学习\python3\py3_test1.txt
import requests
url='https://baidu.com'
response=requests.get(url)
#print(response.text)
print(" ")
print(response.content.decode())
print(" ")
print(response.url)
print(" ")
print(response.status_code)
print(" ")
print(response.request.headers)
print(" ")
print(response.headers)
print(" ")
print(response.request._cookies)
print(" ")
print(response.cookies)
2.1 response.text
- response.text 是 requests模块自动根据HTTP 头部对响应的编码作出有根据的推测,推测的文本编码
- 返回的类型是,str 类型
- print(response.text) 的结果
- 请求baidu.com 可以看到返回的是乱码
1.2 response.content.decode()
- response.content 返回的内容,没有指定解码类型,需要解码
- 缺省默认的是 "utf-8"
- 返回的类型是,byte
1.2.1 response.content.decode() 或者 response.content.decode("utf-8")
print(response.content.decode()) # 注意这里!
#E:\work\FangCloudV2\personal_space\2学习\python3\py3_test1.txt
import requests
url='https://baidu.com'
response=requests.get(url)
#print(response.text)
print(" ")
print(response.content.decode())
1.2.2 response.content.decode("GBK") 报错
1.2.3 关于编码知识
- 如下,还没有整理完
编码方式 | 编码字符集 | |||||
不同的子集 | ||||||
ANSI编码 | 系统默认的编码方式 | 中文GBK,英文ASCII ,繁体中文big5 | ||||
GBXXX编码 | GBXXX字符集 | GB2312-80 | ||||
GBK | 65536 | 2^16 | 双字节编码, (1个字节是8位2进制) (2个字节是16位) 编码范围是0x8140~0xFEFE 共收录了21003个汉字,883个字符 | |||
GB18030 | ||||||
ascii 编码 | ascii 字符集 | 标准ascii 字符集 | 7位 | 2^7 | 128个字符 | |
扩展ascii 字符集 | 8位 | 2^8 | 256个字符 | |||
unicode编码 | utf-8编码,utf-16编码,utf-32编码 | Unicode字符集 | utf-8 兼容 ascii | |||
utf-8编码带BOM 和 无BOM的 | ||||||
UCS-2, UCS-4 | UCS-通用字符集 | ISO | 双字节编码 | |||
BIG5编码 | BIG5字符集 | |||||
源字符集编码 | ||||||
可执行字符集编码 | ||||||
1.3 print(response.url)
print(response.url)
1.4 print(response.status_code)
1.5 print(response.request.headers)
1.6 print(response.headers)
1.7 print(response.request._cookies)
1.8 print(response.cookies)