Python爬虫(2)-Selenium控制浏览器

news2025/1/12 4:07:04

在这里插入图片描述
Selenium中提供了不少的方法来操作浏览器

Selenium控制浏览器

  • 1.打开浏览器
  • 2.打开浏览器后可以控制浏览器前进和后退就使用
  • 3.浏览器刷新
  • 4.浏览器切换网页窗口
  • 5.关闭页面和退出浏览器
  • 6.设置窗口大小
  • 7.获取窗口位置
  • 8.最大化窗口
  • 9.最小化窗口
  • 11.无窗口运行
  • 10.全屏
  • 11.屏幕截图
  • 12.元素截图

1.打开浏览器

使用driver.get(‘网址’)的方式来打开浏览器

from selenium import webdriver
from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.common.by import By
opt = ChromeOptions()            # 创建Chrome参数对象
opt.headless = True              # 把Chrome设置成可视化无界面模式,windows/Linux 皆可
driver = webdriver.Chrome()# Chrome浏览器
driver.get("网址")

2.打开浏览器后可以控制浏览器前进和后退就使用

driver.back()#后退
driver.forward()#前进

3.浏览器刷新

driver.refresh()

4.浏览器切换网页窗口

浏览器切换标签的方法就是,

driver.current_window_handle

用selenium点击新打开了一个网页,需要告知selenium目前这个窗口是新的窗口,那么它才能早新的页面进行操作不然的话就无法操作。

from selenium import webdriver
from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.common.by import By
from selenium.webdriver.support import wait, expected_conditions
from selenium import webdriver

driver = webdriver.Chrome()

driver.get("https://so.csdn.net/so/search?spm=1000.2115.3001.7499&q=%E6%95%B0%E6%8D%AE%E5%BA%93%E8%AF%BE%E7%A8%8B%E8%AE%BE%E8%AE%A1&t=&u=")
driver.refresh()
driver.implicitly_wait(5)
driver.find_element(By.XPATH,'//*[@id="search"]').click()
driver.switch_to.window(driver.window_handles[-1])#表示新的窗口
f1=driver.find_element(By.CSS_SELECTOR,'div.item-hd em').text
print(f1)

在这里插入图片描述
如果只是在页面进行标签操作的话可以用tab切换到新的标签页而不用切换窗口
# 打开新标签页并切换到新标签页
driver.switch_to.new_window(‘tab’)

5.关闭页面和退出浏览器

操作完毕退出页面是

driver.close()

操作完毕退出浏览器是

driver.quit()

6.设置窗口大小

driver.set_window_size(1920,1080)

7.获取窗口位置

x = driver.get_window_position().get(‘x’)
y = driver.get_window_position().get(‘y’)

from selenium import webdriver

driver = webdriver.Chrome()

driver.get("https://so.csdn.net/so/search?spm=1000.2115.3001.7499&q=%E6%95%B0%E6%8D%AE%E5%BA%93%E8%AF%BE%E7%A8%8B%E8%AE%BE%E8%AE%A1&t=&u=")
    # 分别获取每个尺寸
x = driver.get_window_position().get('x')
y = driver.get_window_position().get('y')
print(x,y)

在这里插入图片描述

8.最大化窗口

driver.maximize_window()

9.最小化窗口

driver.minimize_window()

11.无窗口运行

opt = ChromeOptions() # 创建Chrome参数对象
opt.headless = True # 把Chrome设置成可视化无界面模式,windows/Linux 皆可
driver = Chrome(options=opt) # 创建Chrome无界面对象

from selenium import webdriver
from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.common.by import By
from selenium.webdriver.support import wait, expected_conditions
from selenium import webdriver
opt = ChromeOptions()            # 创建Chrome参数对象
opt.headless = True              # 把Chrome设置成可视化无界面模式,windows/Linux 皆可
driver = Chrome(options=opt)     # 创建Chrome无界面对象

driver.get("https://so.csdn.net/so/search?spm=1000.2115.3001.7499&q=%E6%95%B0%E6%8D%AE%E5%BA%93%E8%AF%BE%E7%A8%8B%E8%AE%BE%E8%AE%A1&t=&u=")
driver.refresh()
driver.implicitly_wait(5)
fx=driver.window_handles
print(fx)
driver.find_element(By.XPATH,'//*[@id="search"]').click()
driver.switch_to.window(driver.window_handles[-1])
f1=driver.find_element(By.CSS_SELECTOR,'div.item-hd em').text
print(f1)

10.全屏

driver.fullscreen_window()

11.屏幕截图

driver.save_screenshot(‘./1.png’)

from selenium import webdriver
from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.common.by import By
from selenium.webdriver.support import wait, expected_conditions
from selenium import webdriver
driver = webdriver.Chrome()

driver.get("https://so.csdn.net/so/search?spm=1000.2115.3001.7499&q=%E6%95%B0%E6%8D%AE%E5%BA%93%E8%AF%BE%E7%A8%8B%E8%AE%BE%E8%AE%A1&t=&u=")
driver.refresh()
driver.implicitly_wait(5)
driver.find_element(By.XPATH,'//*[@id="search"]').click()
driver.switch_to.window(driver.window_handles[-1])
f1=driver.find_element(By.CSS_SELECTOR,'div.item-hd em').text
driver.save_screenshot('./1.png')
print(f1)

在这里插入图片描述

12.元素截图

元素截图只是针对这个元素进行截图,但是这种截图只能是一个大概的范围精准度就不太太好。

f1.screenshot(‘./2.png’)

from selenium.webdriver.common.by import By
from selenium import webdriver
driver = webdriver.Chrome()

driver.get("https://so.csdn.net/so/search?spm=1001.2101.3001.4498&q=XPATH%E5%AE%9A%E4%BD%8D&t=&u=&s=hot")
f1=driver.find_element(By.CSS_SELECTOR,'div.search-box')
f1.screenshot('./2.png')
driver.quit()

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/182157.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

opencv函数cv2.warpAffine 和 cv2.warpPerspective 的理解和复现

文章目录opencv函数cv2.warpAffine 和 cv2.warpPerspective 的理解和复现1. warpAffine 函数处理仿射变换2. warp_perspective3, 实验opencv函数cv2.warpAffine 和 cv2.warpPerspective 的理解和复现 1. warpAffine 函数处理仿射变换 仿射矩阵是2 * 3的矩阵。 首…

(深度学习快速入门)第三章第三节5:深度学习必备组件之欠拟合和过拟合

文章目录一:什么是欠拟合和过拟合二:正则化技术(1)加入正则项①:L1正则项②:L2正则项(2)Dropout(暂退法)我们训练模型的目的是为了让模型真正发现一种泛化模式…

个人流媒体服务搭建

简介 主要是个人的流媒体服务器的创建的方式分享 Centos7自建基于HLS的私人直播服务器 相关资源下载 链接:https://pan.baidu.com/s/1zhWFpFRy2v0_lyjA0-AfAg 提取码:yyds 入门操作 实现方法基于nginx和nginx的一个rtmp模块。因为epel源和nginx官…

来源于《高质量C/C++编程》的几道经典面试题

本文介绍几个非常经典的笔试题,原题详细解析,供参考题目1:非法访问内存泄漏题目2:返回栈空间地址问题--非法访问题目3:内存泄漏题目4:非法访问题目1:非法访问内存泄漏 void Getmemory(char* p)…

Apache Doris 系列: 基础篇-使用BitMap函数精准去重(2)

1. 背景 Apache Doris 原有的BitMap函数虽然比较通用, 但在亿级别的BitMap大基数并交计算性能较差,主要是由以下两个原因造成的: 当BitMap的基数过大,大小超过1GB时,网络或者磁盘的处理时间较长BE节点扫描完数据后传…

机器自动翻译古文拼音 - 十大宋词 - 念奴娇 赤壁怀古 苏轼

念奴娇 赤壁怀古 苏轼 大江东去,浪淘尽,千古风流人物。故垒西边,人道是,三国周郎赤壁。乱石穿空,惊涛拍岸,卷起千堆雪。江山如画,一时多少豪杰。 遥想公瑾当年,小乔初嫁了&#xf…

机器自动翻译古文拼音 - 十大宋词 - 扬州慢 淮左名都 姜夔

扬州慢淮左名都 南宋姜夔 淮左名都,竹西佳处,解鞍少驻初程。 过春风十里,尽荠麦青青。 自胡马窥江去后,废池乔木,犹厌言兵。 将黄昏,清角吹寒,都在空城。 杜郎俊赏,算而今重到须惊…

springmvc 整合 thymeleaf 模板引擎

springmvc 整合 thymeleaf 模板引擎 第一步&#xff1a;导入 web.xml 文件 -> <?xml version"1.0" encoding"UTF-8"?> <web-app xmlns"http://xmlns.jcp.org/xml/ns/javaee"xmlns:xsi"http://www.w3.org/2001/XMLSchema-ins…

代码随想录算法训练营第31天 二叉树 java :39. 组合总和 40.组合总和II 131.分割回文串

文章目录LeetCode 39. 组合总和本题题解思路LeetCode 40.组合总和II本题题解思路LeetCode 131.分割回文串本题题解思路那么在代码里什么是切割线呢&#xff1f;那么在代码里什么是切割线呢&#xff1f;总结LeetCode 39. 组合总和 本题题解 思路 根据递归三部曲来分析 递归函…

网站如何进行整站优化?

如果要做优化或者选择性优化&#xff0c;一定要区分关键词优化和全站优化&#xff0c;米贸搜整理如下&#xff0c;希望可以帮助到你&#xff1a;一、全站优化的概念:1.一般认为&#xff0c;全站点优化是指通过SEO技术&#xff0c;使其网站成为搜索引擎中的权威站点。当达到效果…

面试汇总-多线程

目录 1、Thread.sleep(0)的作用 2、Synchronized 2.1、特性 2.2、说一说自己对于 synchronized 关键字的了解&#xff1a; 2.3、synchronized关键字的底层原理(JVM如何实现重量级锁) 2.4、Jdk1.6之后对synchronized做的优化 2.4.1、锁粗化 2.4.2、锁消除 2.5、线程池的…

Scala运算符

算术运算符 关系运算符 Java 和 Scala 中关于“”的区别 逻辑运算符 赋值运算符 位运算符 Scala运算符总结 算术运算符 基本与Java一致 对于除号“/”&#xff0c;它的整数除和小数除是有区别的&#xff1a;整数之间做除法时&#xff0c;只保留整 数部分而舍弃小数部分…

JDBC学习笔记(黑马)

目录 一、JDBC快速入门 二、JDBC API详解 &#xff08;一&#xff09;DriverManager &#xff08;二&#xff09;Connection &#xff08;三&#xff09;Statement &#xff08;四&#xff09;ResultSet &#xff08;五&#xff09;PreparedStatement 三、数据库连接池…

前端实现水印的两种方式(DOM和Canvas)

&#x1f431; 个人主页&#xff1a;不叫猫先生 &#x1f64b;‍♂️ 作者简介&#xff1a;前端领域新星创作者、阿里云专家博主&#xff0c;专注于前端各领域技术&#xff0c;共同学习共同进步&#xff0c;一起加油呀&#xff01; &#x1f4ab;系列专栏&#xff1a;vue3从入门…

Python 海象运算符

✅作者简介&#xff1a;人工智能专业本科在读&#xff0c;喜欢计算机与编程&#xff0c;写博客记录自己的学习历程。 &#x1f34e;个人网站&#xff1a;小嗷犬的技术小站 &#x1f34a;个人信条&#xff1a;为天地立心&#xff0c;为生民立命&#xff0c;为往圣继绝学&#xf…

图纸版本混乱?BOM表管理困难?看SolidWorks PLM如何高效助力产品数据管理

“随着集团的日益壮大&#xff0c;我们越来越重视信息化系统的建设工作&#xff0c;但在研发生产的过程中我们经常会遇到图纸版本混乱、数据查找不便的问题&#xff1b;特别是在产品设计好后&#xff0c;还需要花费很多时间手动整理BOM表&#xff0c;整理期间由于数据量太大&am…

2023年,对人工智能的思考与展望

近些年来&#xff0c;人工智能的话题一次次的冲上热榜&#xff0c;而在前段时间内&#xff0c;chatgpt以及midjourney又一次冲上了热搜&#xff0c;在海内外引起广泛的讨论&#xff0c;我个人在研究了近一个多月的技术文档和文献资料后&#xff0c;也对人工智能的未来有了很多的…

STC32G 单片机通用串行通信接口及其编程

STC32G 系列单片机有4个全双工通用串行通信接口&#xff0c;串口1与串口2既有异步通信功能、又有同步通信功能&#xff0c;串口1与串口2都可进行SPI通信&#xff0c;SPI是一个全双工高速同步串行&#xff1b;通信总线串口3、串口4只有异步通信功能。本文将重点讨论其异步通信&a…

hexo个人博客搭建+butterfly主题配置(雏形版本)

前提&#xff1a; 1. 有一个属于自己的GitHub账号 2. 安装好了git 3. 安装好了node 一、安装hexo 1. 建立一个文件夹 Blog&#xff08;可以自己取名字&#xff09;&#xff0c;进入文件夹标右键打开 Git Bush Here&#xff0c;安装Hexo&#xff1a; npm install -g hexo-…

中智股份冲刺上交所上市:半年收入约87亿元,计划募资37亿元

近日&#xff0c;中智经济技术合作股份有限公司&#xff08;下称“中智股份”&#xff09;预披露招股书&#xff0c;准备在上海证券交易所主板上市&#xff0c;中信证券为其保荐机构。 本次冲刺上市&#xff0c;中智经济计划募资37.42亿元&#xff0c;将用于中智人力资源研发运…