【网络安全带你练爬虫-100练】第1练:发送请求获取返回内容

news2024/10/5 14:52:31

目录

一、前置知识1

二、前置知识2

requests库的7个主要方法

语法:

注解:

三、扩展工具

四、网络安全小圈子


一、前置知识1

顾名思义网络爬虫第一步,爬取目标 URL的网页的信息

可以使用 urllib.request 和 requests发送请求,然后返回对应的数据(py3)

1、urllib 库是 Python 内置的

2、requests 库是第三方库(需额外安装,pip install requests)



二、前置知识2

requests库的7个主要方法

方法    说明
requests.request()    构造一个请求
requests.get()    获取HTML网页的主要方法(即HTTP的GET)
requests.head()    获取HTML网页头的信息方法(即HTTP的HEAD)
requests.post()    向HTML网页提交POST请求方法(即HTTP的POST)
requests.put()    向HTML网页提交PUT请求的方法(即HTTP的PUT)
requests.patch()    向HTML网页提交局部修改请求(即HTTP的PATCH)
requests.delete()    向HTML页面提交删除请求(即HTTP的DELETE)


语法:

requests.request(method,url,**kwargs)

注解:

1、method:请求方式(get/put/post等七种)

如resp = requests.request(‘GET’,url,**kwargs)


2、url:目标url

必选项(不可或缺)


3、**kwargs:控制访问参数(13个,为可选项)

params : 字典或字节序列,作为参数增加到url中
data : 字典、字节序列或文件对象,作为Request的内容
json : JSON格式的数据,作为Request的内容
headers : 字典,HTTP定制头(模拟浏览器进行访问)
cookies : 字典或CookieJar,Request中的cookie
files : 字典类型,传输文件
timeout : 设定超时时间,秒为单位
proxies : 字典类型,设定访问代理服务器,可以增加登录认证
allow_redirects : True/False,默认为True,重定向开关
stream : True/False,默认为True,获取内容立即下载开关
verify : True/False,默认为True,认证SSL证书开关
cert : 本地SSL证书路径
auth : 元组,支持HTTP认证功能

import requests

if __name__ == '__main__':
    url1="https://beautifulsoup.readthedocs.io/zh_CN/latest/"
    req=requests.get(url=url1)
    req.encoding='utf-8'
    print(req.text)

注:

导入requests模块。

如果该脚本被直接执行(而不是被引入为模块),则执行以下操作:

  • 将变量url1赋值为"Beautiful Soup 4.4.0 文档 — beautifulsoup 4.4.0q 文档"。
  • 使用requests.get()函数发送一个GET请求到url1指定的URL,并将返回的响应对象赋值给变量req
  • 设置req对象的编码为UTF-8。
  • 打印req.text,即获取到的响应文本内容。

获取到的返回包内容在最下方方框中

(使用pycharm工具)

 

 



三、扩展工具

jupyter notebook工具(平时可能都习惯使用pycharm)

安装

pip3 install jupyter

查看帮助信息

jupyter notebook -h

启动

jupyter notebook

(如果端口占用的情况:jupyter notebook --port <port_number>)

 进入到了主页面

(还有很多配置,可以使界面更清爽,我只想使用软件的功能,界面想配置清爽可以查看一下软件的其他配置)

软件的使用:

如图所示点击完成以后会新建一个窗口

在里面复制代码运行即可



四、网络安全小圈子

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/704977.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

瞄准光储赛道的家电巨头,是没活“硬整”,还是有理有据?

2023年上半年即将结束&#xff0c;家电巨头再次带来跨界的重磅消息。 在A股公司合康新能月底发布的定增公告中&#xff0c;美的集团&#xff0c;成为合康新能定增的包揽者。后者将获得前者提供的高达14.73亿元的募集资金总额&#xff0c;用于电子设备业务能力提升项目、光伏产…

一部手机如何登录多个微信?教你一招轻松搞定

现在大部分人都不止2个微信&#xff0c;有的用于私人社交&#xff0c;有的用于工作&#xff0c;人手多个微信已经很普遍了。那么如何在一个手机上同时登录2个甚至更多微信呢&#xff1f; 01登录2个微信 找到手机上面的【设置】&#xff0c;找到【应用设置】-【应用双开】&am…

Redis通信协议

RESP协议 Redis是一个CS架构的软件&#xff0c;通信一般分两步&#xff08;不包括pipeline和PubSub&#xff09;&#xff1a; ① 客户端&#xff08;client&#xff09;向服务端&#xff08;server&#xff09;发送一条命令 ② 服务端解析并执行命令&#xff0c;返回响应结果…

拧螺丝需求:递归算法的极致应用

前言 在一个平平无奇的下午&#xff0c;接到一个需求&#xff0c;需要给公司的中台系统做一个json报文重组的功能。 因为公司的某些业务需要外部数据的支持&#xff0c;所以会采购一些其它公司的数据&#xff0c;而且为了保证业务的连续性&#xff0c;同一种数据会采购多方的数…

电子模块|航空插头简介

电子模块|航空插头简介 航空插头图片航空插头介绍为什么要用航插航空插头实例及参数 航空插头图片 航空插头介绍 航空插头定义&#xff1a; 它是针对复杂工业环境与户外环境等应用场景开发的一类连接器。正式一些的称呼是“工业连接器”&#xff0c;主要用于电气、电子设备的电…

react菜鸟教程学习笔记

目录 第一个react实例 react安装 对react机制最直观的理解 如果你第一次用npm 关于初始化package.json的问题 使用 create-react-app 快速构建 React 开发环境 项目目录结构 修改一下代码执行源头APP.js React元素渲染 将元素渲染到DOM中 更新元素渲染 关于vue的更新…

Dlib —— 对图片进行人脸检测(附C++源码)

效果 注意&#xff1a;Dlib检测人脸在Release版耗时与CPU有关,本人I7 10代约100ms左右。建议人脸检测可以考虑使用Yolov5进行&#xff0c;之后将检测到的人脸输入给Dlib做特征或其他。 代码 Vs2017下使用Dlib检测人脸&#xff0c;并通过OpenCv将结果绘制出来。&#xff08;由于…

推荐几个数据可视化工具汇总

数据的魅力在于其故事性和洞察力。让数据说话&#xff0c;我们汇集了一系列令人兴奋的数据可视化工具&#xff0c;为您提供展示和探索数据的无限可能。 分享一&#xff1a;Tangle Tangle是一个基于Web的数据可视化工具&#xff0c;旨在帮助大家以交互式和可视化的方式探索和解…

使用chatgpt过funcaptcha验证码2个人学习记录

funcaptcha 验证码2 通过记录 ** funcaptcha 那个公司开发的简要介绍&#xff1a; Funcaptcha是由hCaptcha公司开发的一种人机验证系统。hCaptcha是一家位于美国的人机验证技术提供商&#xff0c;旨在帮助网站和应用程序防止自动化攻击和滥用。 Funcaptcha是hCaptcha提供的一种…

MYSQL 数据清理磁盘没变小问题解决方法

我们到数据目录查看有些表比较大&#xff0c;清理了一些无用数据后发现&#xff0c;文件大小不变。这是mysql的机制导致的。 解决方法&#xff1a;重建索引释放空间。 alter table $TABLE engineInnoDB;

接口测试的流程

目录 前言&#xff1a; 接口测试流程 接口测试用例设计 接口测试工具 前言&#xff1a; 接口测试是软件测试中的一个关键环节&#xff0c;用于验证系统的各个接口是否符合预期功能和性能要求。 接口通俗的理解就是不同部分之间的连接通道&#xff0c;可以是程序之内的&am…

原码、反码及补码

任何存储于计算机中的数据&#xff0c;其本质都是以二进制码存储。计算机的运算器只有加法运算器。所以在计算机中没办法直接做减法。 从硬件的角度来说正数正数、负数负数都是可以通过加法器直接相加&#xff0c;只有正数加负数才算是减法。原码、反码及补码的产生过程就是为…

HOT30-两两交换链表中的节点

leetcode原题链接&#xff1a;两两交换链表中的节点 题目描述 给你一个链表&#xff0c;两两交换其中相邻的节点&#xff0c;并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题&#xff08;即只能进行节点交换&#xff09;。 示例 1&#xff1a; 输入&a…

0055. 跳跃游戏

0055. 跳跃游戏 原题链接&#xff1a;完成情况&#xff1a;解题思路&#xff1a;参考代码&#xff1a;__55跳跃游戏01__动态规划__55跳跃游戏01__贪心 原题链接&#xff1a; 0055. 跳跃游戏 https://leetcode-cn.com/problems/jump-game/ 完成情况&#xff1a; 解题思路&…

MySql学习2:SQL分类、数据库操作、表操作、数据的增删改查

SQL分类 SQL分类&#xff1a; DDL&#xff1a;数据定义语言&#xff0c;用来定义数据库对象&#xff08;数据库、表、字段&#xff09;DML&#xff1a;数据操作语言&#xff0c;用来对数据库表中的数据进行增删改DQL&#xff1a;数据库查询语言&#xff0c;用来查询数据库表中…

jsp SSM宠物网站系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 jsp 宠物网站系统是一套完善的java web信息管理系统&#xff0c;对理解JSP java编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为 TOMCAT7.0,eclipse开发&#xff0c;数据库为Mysql5.0&#xff0…

JavaScript 中有趣的 9 个常用编码套路

大厂面试题分享 面试题库 前后端面试题库 &#xff08;面试必备&#xff09; 推荐&#xff1a;★★★★★ 地址&#xff1a;前端面试题库 web前端面试题库 VS java后端面试题库大全 我今天仔细研究了一下掘金上的热门文章数据和内容。我发现你们真是热衷于学习&#xff0c;喜…

#10045. 「一本通 2.2 练习 1」Radio Transmission(内附封面)

[BOI2009] Radio Transmission 无线传输 题目描述 给你一个字符串 s 1 s_1 s1​&#xff0c;它是由某个字符串 s 2 s_2 s2​ 不断自我连接形成的&#xff08;保证至少重复 2 2 2 次&#xff09;。但是字符串 s 2 s_2 s2​ 是不确定的&#xff0c;现在只想知道它的最短长度…

springboot流浪动物救助系统-计算机毕设 附源码78174

springboot流浪动物救助系统 摘 要 21世纪的今天&#xff0c;随着社会的不断发展与进步&#xff0c;人们对于信息科学化的认识&#xff0c;已由低层次向高层次发展&#xff0c;由原来的感性认识向理性认识提高&#xff0c;管理工作的重要性已逐渐被人们所认识&#xff0c;科学…

目标检测算法-YOLOV8解析(附论文和源码)

目标检测算法-YOLOV8解析&#xff08;附论文和源码&#xff09;