【网络安全带你练爬虫-100练】第1练：发送请求获取返回内容

news2026/2/11 13:26:39

一、前置知识1

二、前置知识2

requests库的7个主要方法

语法：

注解：

三、扩展工具

四、网络安全小圈子

一、前置知识1

顾名思义网络爬虫第一步，爬取目标 URL的网页的信息

可以使用 urllib.request 和 requests发送请求，然后返回对应的数据（py3）

1、urllib 库是 Python 内置的

2、requests 库是第三方库（需额外安装，pip install requests）

二、前置知识2

requests库的7个主要方法

方法	说明
requests.request()	构造一个请求
requests.get()	获取HTML网页的主要方法（即HTTP的GET）
requests.head()	获取HTML网页头的信息方法（即HTTP的HEAD）
requests.post()	向HTML网页提交POST请求方法（即HTTP的POST）
requests.put()	向HTML网页提交PUT请求的方法（即HTTP的PUT）
requests.patch()	向HTML网页提交局部修改请求（即HTTP的PATCH）
requests.delete()	向HTML页面提交删除请求（即HTTP的DELETE）

语法：

requests.request(method,url,**kwargs)

注解：

1、method：请求方式（get/put/post等七种）

如resp = requests.request(‘GET’,url,**kwargs)

2、url：目标url

必选项（不可或缺）

3、**kwargs：控制访问参数（13个，为可选项）

params : 字典或字节序列，作为参数增加到url中
data : 字典、字节序列或文件对象，作为Request的内容
json : JSON格式的数据，作为Request的内容
headers : 字典，HTTP定制头（模拟浏览器进行访问）
cookies : 字典或CookieJar，Request中的cookie
files : 字典类型，传输文件
timeout : 设定超时时间，秒为单位
proxies : 字典类型，设定访问代理服务器，可以增加登录认证
allow_redirects : True/False，默认为True，重定向开关
stream : True/False，默认为True，获取内容立即下载开关
verify : True/False，默认为True，认证SSL证书开关
cert : 本地SSL证书路径
auth : 元组，支持HTTP认证功能

import requests

if __name__ == '__main__':
    url1="https://beautifulsoup.readthedocs.io/zh_CN/latest/"
    req=requests.get(url=url1)
    req.encoding='utf-8'
    print(req.text)

注：

导入requests模块。

如果该脚本被直接执行（而不是被引入为模块），则执行以下操作：

将变量url1赋值为"Beautiful Soup 4.4.0 文档 — beautifulsoup 4.4.0q 文档"。
使用requests.get()函数发送一个GET请求到url1指定的URL，并将返回的响应对象赋值给变量req。
设置req对象的编码为UTF-8。
打印req.text，即获取到的响应文本内容。

获取到的返回包内容在最下方方框中

（使用pycharm工具）

三、扩展工具

jupyter notebook工具（平时可能都习惯使用pycharm）

安装

pip3 install jupyter

查看帮助信息

jupyter notebook -h

启动

jupyter notebook

（如果端口占用的情况：jupyter notebook --port <port_number>）

进入到了主页面

（还有很多配置，可以使界面更清爽，我只想使用软件的功能，界面想配置清爽可以查看一下软件的其他配置）

软件的使用：

如图所示点击完成以后会新建一个窗口

在里面复制代码运行即可

四、网络安全小圈子

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/704977.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【网络安全带你练爬虫-100练】第1练：发送请求获取返回内容

一、前置知识1

二、前置知识2

requests库的7个主要方法

语法：

注解：

三、扩展工具

四、网络安全小圈子

相关文章

瞄准光储赛道的家电巨头，是没活“硬整”，还是有理有据？

一部手机如何登录多个微信？教你一招轻松搞定

Redis通信协议

拧螺丝需求：递归算法的极致应用

电子模块|航空插头简介

react菜鸟教程学习笔记

Dlib —— 对图片进行人脸检测（附C++源码）

推荐几个数据可视化工具汇总

使用chatgpt过funcaptcha验证码2个人学习记录

MYSQL 数据清理磁盘没变小问题解决方法

接口测试的流程

原码、反码及补码

HOT30-两两交换链表中的节点

0055. 跳跃游戏

MySql学习2：SQL分类、数据库操作、表操作、数据的增删改查

jsp SSM宠物网站系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

JavaScript 中有趣的 9 个常用编码套路

#10045. 「一本通 2.2 练习 1」Radio Transmission（内附封面）

springboot流浪动物救助系统-计算机毕设附源码78174

目标检测算法-YOLOV8解析（附论文和源码）