python—requests模块详解

news2024/11/25 0:41:03

一、前言

1、requests简介

requests是一个很实用的Python HTTP客户端库,爬虫和测试服务器响应数据时经常会用到,它是python语言的第三方的库,专门用于发送HTTP请求,使用起来比urllib更简洁也更强大。

2、requests库的安装

方法1:命令行安装

  • windows操作系统:pip install requests
  • Mac操作系统:pip3 install requests
  • Linux操作系统:sodo pip install requests

方法2:源码安装

  • 下载 requests源码 http://mirrors.aliyun.com/pypi/simple/requests/
  • 下载文件到本地之后,解压到Python安装目录,之后打开解压文件
  • 运行命令行输入python setup.py install 即可安装

二、常用方法

序号方法描述
1requests.request(url)构造一个请求,支持以下各种方法
2requests.get()发送一个Get请求
3requests.post()发送一个Post请求
4requests.head()获取HTML的头部信息
5requests.put()发送Put请求
6requests.patch()提交局部修改的请求
7requests.delete()提交删除请求

其中最常用的方法为get()和post(),分别用于发送Get请求和Post请求。

三、常用属性

序号属性或方法描述
1response.status_code响应状态码
2response.content把response对象转换为二进制数据
3response.text把response对象转换为字符串数据
4response.encoding定义response对象的编码
5response.cookie获取请求后的cookie
6response.url获取请求网址
7response.json()内置的JSON解码器
8Response.headers以字典对象存储服务器响应头,字典键不区分大小写

四、发送请求

1、发送GET请求

1) 不带参数的请求

import requests
#定义百度URL,获取百度首页
url = "http://www.baidu.com"
#使用GET发起请求
res = requests.get(url)
#将返回对象的2进制数据进行解码并输出(根据响应解过中的HTML头判断编码类型)
print(res.content.decode("UTF-8"))

2) 带参数的请求

将参数放在URL中进行请求:

import requests
#将参数name和age拼接到URL中进行请求
res = requests.get(http://httpbin.org/get?name=gemey&age=22)
#输出返回对象的文本结果
print(res.text)

将参数写在字典中进行请求:

import requests
#将参数name和age定义到字典params中
params={
	"name":"tony",
	"age":20
}
url="http://httpbin.org/get"
#发送请求参数
res = requests.get(url=url,params=params)
#输出返回对象的文本结果
print(res.text)

自定义HTTP头信息进行请求:

import requests

# 将参数name和age定义到字典params中
params = {
	"name": "tony",
	"age": 20
}
url = 'http://httpbin.org/get'

# 定义HTTP头信息,cookie,UA和referer
headers = {
    "User-agent": "Mozilla/5.0 (Linux; Android 8.1.0; SM-P585Y) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36",
    "referer": "https://www.abidu.com",
    "Cookies": "1234565678"
}

# 发送请求参数
res = requests.get(url = url,params = params,headers = headers)

# 输出返回对象的文本结果
print(res.text)

2、发送POST请求

POST请求一般用于提交参数,所以直接进行有参数的POST请求测试。

import requests

# 将参数name和age定义到字典params中
params = {
	"name": "tony",
	"age": 20
}

url = 'http://httpbin.org/post'

# 定义HTTP头信息
headers = {
    "User-agent": "Mozilla/5.0 (Linux; Android 8.1.0; SM-P585Y) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36",
    "referer": "https://www.abidu.com",
    "Cookies": "username=user1&passwd=passwd"
}
# 发送请求参数
res = requests.post(url = url,params = params,headers = headers)
# 输出返回对象的文本结果
print(res.text)

五、读取内容

requests对象的get和post方法都会返回一个Response对象,这个对象里面存的是服务器返回的所有信息,包括响应头,响应码等。

上面提到了,对于request,常用的属性有content、text、json、cookie等。content和text两者区别在于,content中间存的是字节码,而text中存的是Beautifulsoup模块根据猜测的编码方式将content内容编码成字符串后的结果。

直接输出content,会发现前面存在b’这样的标志,这是字节字符串的标志,而text是没有前面的b,对于纯ascii码,这两个可以说一模一样,对于其他的文字,需要正确编码才能正常显示。

大部分情况下,我们可以直接使用text,但是当有中文的时候,直接使用text会显示乱码,所以需要使用content对象来手动进行解码后才能正常显示。

而json属性则是利用内置的json解析模块解析json数据。

cookie属性则是直接获取响应头中的cookie。

1、以content方式读取

import requests

url = "http://www.baidu.com"

res = requests.get(url)
#不进行解码,直接输出
print(res.content)

输出结果:

在这里插入图片描述

进行解码后输出:

在这里插入图片描述

2、以text方式读取

import requests

url = "http://www.baidu.com"

res = requests.get(url)

print(res.text)

输出结果: 中文存在乱码

在这里插入图片描述

3、读取json数据

import requests

params = {
	"name": "tony",
	"age": 20
}
url = 'http://httpbin.org/get'

headers = {
    "referer": "https://www.abidu.com",
    "Cookies": "1234565678"
}

res = requests.get(url = url,params = params,headers = headers)

print(res.cookies)

输出结果:将json数据转换为字典进行输出

在这里插入图片描述

4、获取cookies

import requests

url = 'https://www.baidu.com'
 
res = requests.get(url = url)

print(res.cookies.extract_cookies)

读取cookie时,直接使用reponse.cookie会返回一个RequestsCookieJar对象,不会直接显示cookie的信息,所以需要再使用extract_cookies属性对该对象进行解析,结果如下:

在这里插入图片描述

六、其他方法

1、设置超时退出

可以通过timeout属性设置超时时间,一旦超过这个时间还没获得响应内容,就会提示错误。

import requests

url = 'https://www.baidu.com'

#设置超时时间上限为1s
res = requests.get(url = url,timeout=1)

print(res.content.decode("UTF-8"))

2、异常处理

import requests

url = 'https://www.baidu.com'

#设置超时时间上限为1s,并使用try语句处理异常
try:
	res = requests.get(url = url,timeout=1)
    print(res.content.decode("UTF-8"))
except exceptions.Timeout as e:
    print(e)
except exceptions.HTTPError as e:
    print(e)

3、设置代理

代理格式: proxies = { ‘协议’:‘协议://IP:端口号’}

提示: 当我们抓取的地址为http时,使用http代理,反之使用https代理

示例:

import requests

url = 'https://www.baidu.com'

#使用字典定义代理
proxies={
	'http':'http://123.45.67.76:8888'
	'https':'http://123.45.67.76:4433'
}
#设置超时时间上限为1s,并使用try语句处理异常
try:
	res = requests.get(url = url,timeout=1,proxies=proxies)
    print(res.content.decode("UTF-8"))
except exceptions.Timeout as e:
    print(e)
except exceptions.HTTPError as e:
    print(e)

4、使用Session进行会话管理

直接 requests.get() 或者 requests.post() 发送GET请求或POST请求;当然也是可以带上 cookies 和 headers 的,但这都是一次性请求,你这次带着cookies信息,后面的请求还得带。如果使用sessionl来发起请求,session实例在请求了一个网站后,对方服务器设置在本地的cookie会保存在session中,下一次再使用session请求对方服务器的时候,会带上前一次的cookie,从而实现回话保持。

import requests

#使用session,需要先实例化一个session对象。
session = requests.session()

headers = {
        'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36",
        'Referer': "https://creator.douyin.com/"
}

url = "https://sso.******.com/get_qrcode/?next=https:%2F%2Fcreator.douyin.com%2Fcreator-micro%2Fhome&aid=2906&service=https:%2F%2Fcreator.douyin.com&is_vcd=1&fp=ktv0uumo_gD7FPCuy_MfX7_44zL_9T1C_6i8sUgr4bDT6"

data1 = {
    "name" : "test",
    "passwd" : "passwd"
}
data2 = {
    "name" : "test",
    "age" : 20
}
#使用session对象发起请求,进行登录。
try:
	res = session.get(url = url,timeout=1,headers = headers,data=data1)
    print(res.json())
    #使用的登录后的session对需要登录的操作再次发起请求。
    res2 = session.post(url,data=date2)
except exceptions.Timeout as e:
    print(e)
except exceptions.HTTPError as e:
    print(e)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/336882.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CUDA中的数学方法

CUDA中的数学方法 文章目录CUDA中的数学方法1. Standard FunctionsSingle-Precision Floating-Point FunctionsDouble-Precision Floating-Point Functions2. Intrinsic FunctionsSingle-Precision Floating-Point FunctionsDouble-Precision Floating-Point Functions参考手册…

ROPR:一款功能强大的极速多线程ROPGadget查找工具

关于ROPR ROPR是一款速度极快且功能强大的ROPGadget查找工具,该工具支持多线程运行,可以帮助广大研究人员快速寻找和定位目标ROPGadget。 ROP(Return Oriented Programming),即返回导向编程,而ROPGadget是…

算法训练营DAY52|1143.最长公共子序列、1035.不相交的线、53. 最大子序和

前两道题思路是一模一样的,但是需要认真理解,最后一道虽然思路不算难,但是需要注意的细节一点不少。 1143. 最长公共子序列 - 力扣(LeetCode)https://leetcode.cn/problems/longest-common-subsequence/最长公共子序列…

2-ChatGPT插件到Google浏览器、Firefox浏览器,并进行ChatGPT工作。

ChatGPT插件到Google浏览器、Firefox浏览器,并进行ChatGPT工作。1,首先,在装插件ChatGPT forGoogle插件时,我没安装成功,问题是我没有区分Google浏览器和双核浏览器的差别。2,如何使用ChatGPT在浏览器上进行…

基于北方苍鹰算法优化LSTM(NGO-LSTM)研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

2023软件测试面试全方位话术,你想要的全都有

目录 2023软件测试面试话术包含:自我介绍简历人资题话术面试题项目介绍 自我介绍 软件测试基础面试题 人资高频率问题 简历 总结 2023软件测试面试话术包含:自我介绍简历人资题话术面试题项目介绍 目录如下 自我介绍 软件测试基础面试题 需求的标准…

参数嗅探 - 为何产生

这个问题会在参数话的SQL语句(例如存储过程)与SQL Server里的计划缓存机制结合的时候会出现。这个文章分为2个部分,第1部分会介绍下参数嗅探(Parameter Sniffing)的概况,第2部分我们介绍下如何解决这个问题…

git整体工作流程

文章目录本地流程远程仓库流程git 代码量统计本地流程 工作区 暂存区 本地仓库 远程仓库流程 git 代码量统计 # 统计本地仓库的代码量 git log --all --since2022-01-01 --until2022-01-05 --format"%aN" --no-merges | sort | uniq -c | while read data; do na…

浅析 SeaweedFS 与 JuiceFS 架构异同

SeaweedFS 是一款高效的分布式文件存储系统,最早的设计原型参考了 Facebook 的 Haystack,具有快速读写小数据块的能力。本文将通过对比 SeaweedFS 与 JuiceFS 在设计与功能上的差异,以帮助读者进行更适合自己的选择。 SeaweedFS 系统结构 S…

【树】平衡二叉搜索树的介绍与构建

二叉平衡搜索树一、平衡二叉搜索树的概述1. 平衡二叉树的性质2. 平衡二叉树的最小节点数(公式及其原理)a. 树高度和深度的区别b. 原理二、平衡二叉树的创建和调整1. 节点2. 旋转四种姿态a. LL旋转b. RR旋转c. LR旋转d. RL旋转2. 节点的插入3. 节点的删除…

[转]深度学习 Transformer架构解析

原文链接:https://blog.csdn.net/mengxianglong123/article/details/1262614791.1 Transformer的诞生2018年10月,Google发出一篇论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》, BERT模型横空出世, 并横扫N…

分享5款后台收到的推荐最多的软件

最近后台收到好多小伙伴的私信,今天继续推荐五款小工具,都是免费使用的,大家可以去试试看。 1.视频压缩——Moo0 VideoMinimizer 一款完全免费的视频压缩软件,能够有效的将视频压缩到最小,同时还不改变视频画质很清晰…

基于SpringBoot的房屋租赁管理系统的设计与实现

基于SpringBoot的房屋租赁管理系统的设计与实现 1 绪论 1.1 课题来源 随着社会的不断发展以及大家生活水平的提高,越来越多的年轻人选择在大城市发展。在大城市发展就意味着要在外面有一处安身的地方。在租房的过程中,大家也面临着各种各样的问题&…

Java程序设计-基于Java高校社团管理系统

摘 要功能需求系统的功能实现摘 要 当前,大多数高校的社团信息管理都是采用纸质档案的方式来管理的,这样不仅不能长期的保存信息,而且在数据的查找上带来很大的不方便。在目前的网络技术和计算机技术的普及和信息管理的迅速发展,…

【MySQL】你知道的MySQL中的集合函数有哪些呢?

集合函数排名AVG()函数COUNT()函数SUM()函数MAX()函数 和 MIN()函数总结大家好,我是小冷。 上一篇写了 看看ChatGPT是如何回答面试官的问题的? 地址是&#x…

MySQL数据库06——条件查询(WHERE)

MySQL条件查询,主要是对数据库里面的数据按照一定条件进行筛选,主要依靠的是WHERE语句进行。 先来了解一下基础的条件运算。 关系运算符 逻辑运算符 逻辑运算符优先级:NOT>AND>OR,关系运算符>逻辑运算符 SQL特殊运算符…

公司常用的Project管理工具

目录 1.svn 2.reviewBoard 3.禅道 4.瘦终端 1.svn svn主要是对代码的管理,保证代码的同步开发。 svn的搭建方法https://www.cnblogs.com/ftx3q/p/15340160.html 2.reviewBoard reviewBoard代码审查工具,所有工程师写的代码上传到reviewBoard&#x…

前端将本地代码项目上传到gitee上

文章目录前言一、gitee建立仓库?1.登入并新建账号2.填写仓库信息3.传项目前言 因为以前跟B站做了一些项目,想上传到gitee仓库保留。所以写下此文章。前端项目 一、gitee建立仓库? 1.登入并新建账号 2.填写仓库信息 readme文件是否选择&#…

C++类基础(十)

运算符重载 struct Str {int val 3; }; Str Add(Str x, Str y) {Str z;z.val x.val y.val;return z; } int main() {int val1 2;int val2 3;int val3 val1 val2; //分别对val1和val2求值然后相加Str x;Str y;Str z Add(x, y); //同样的功能,但是写法冗杂St…

【GPLT 二阶题目集】L2-004 这是二叉搜索树吗?

参考文章:L2-004. 这是二叉搜索树吗?-PAT团体程序设计天梯赛GPLT 作者:柳婼(非常感谢!!!) 一棵二叉搜索树可被递归地定义为具有下列性质的二叉树:对于任一结点, 其左子树中所有结点的键值小于…