一文速学-selenium高阶操作连接已存在浏览器

news2025/1/11 15:41:47

前言

不得不说selenium不仅在自动化测试作为不可或缺的工具,在数据获取方面也是十分好用,能够十分快速的见到效果,这都取决于selenium框架的足够的灵活性,甚至在一些基于web端的自动化办公都十分有效。

通过selenium连接已经存在数据存储的浏览器,可以通过这种方式绕过短期内无法解决的验证码的识别,也可以绕过大部分网页保护措施。那么现在就来看看我们如何实现。

启动浏览器

首先我们要了解浏览器存储了多种内容,其中一些可以在不同网站或网页之间共享,而其他一些则受限于特定的域或浏览器安全策略。

1.Cookies

想象 Cookies 像是酒店的门房,每当你进出酒店(即网站)时,门房都会记住你(存储信息)。他们在你每次访问时识别你,并记住你的偏好(如房间偏好)。但门房的记忆空间很小,只能记住一些基本信息。同时,门房每次见到你都会提醒酒店你的偏好(Cookies 随着每次 HTTP 请求发送到服务器)。

Cookies存储十分重要,Cookies网站为了记录用户信息(如登录状态、用户偏好设置等)而存储在用户本地的小型数据片段。通常只能被设置它们的那个网站访问。不过,有些 cookies(如第三方 cookies)可能被多个网站共享,用于跟踪用户在不同网站的行为。具体介绍在博主前篇文章有详细介绍,有兴趣的请去阅读,这里暂不展开。

2. Local Storage

Local Storage 像是你在酒店房间内的保险箱。它可以存储更多的东西,只要你不清空保险箱或离开酒店(关闭浏览器),你的物品就一直安全地存放在那里。这些物品只属于这个房间,换到别的房间(另一个网站或浏览器标签)时,就无法访问这些物品了。

Local Storage 是一种允许网站在用户的浏览器上存储数据的机制。它是 HTML5 Web Storage API 的一部分,旨在克服传统的 cookie 存储的限制,提供了一种更加安全和高效的方式来存储数据。

  • 容量限制:与 cookies 相比,Local Storage 提供更大的存储空间(通常至少 5MB)。

  • 生命周期:Local Storage 中的数据没有过期时间,数据会一直存在直到被显式清除,无论浏览器窗口或标签页是否关闭。

  • 域限制:数据存储是基于域名的。一个网站只能访问它自己设置的数据,无法访问其他网站的 Local Storage。

  • 同源策略:遵循同源策略,即协议、域名和端口号都必须与存储数据的原始网站一致。

虽然 Local Storage 提供的存储空间比 cookies 多,但它仍有限制(一般为 5-10 MB),并且不同浏览器可能有所不同。数据在不同的浏览器会话间是持久的,但它不适用于跨浏览器的数据共享。Local Storage 存储的数据不会随着 HTTP 请求被发送,这有助于提高安全性。但它仍然是存储在客户端,因此不应该用来存储敏感信息。几乎所有现代浏览器都支持 Local Storage,包括移动端浏览器。

3.Session Storage

Session Storage 是 Web Storage API 的一部分,它提供了一种在用户浏览器上存储数据的机制。与 Local Storage 类似,Session Storage 用于存储键值对数据,但它的生命周期和作用域与 Local Storage 有所不同。

  • 生命周期:Session Storage 中的数据只在当前浏览器会话期间有效。一旦浏览器窗口或标签页被关闭,存储的数据就会被清除。

  • 存储容量:和 Local Storage 一样,Session Storage 提供较大的存储容量(通常至少 5MB),远大于 cookies。

  • 作用域:数据存储在特定的窗口或标签页内,即使是相同的网站,在不同的标签页或窗口中的 Session Storage 也是独立的。

  • 同源策略:Session Storage 遵守同源策略,即协议、域名和端口号都必须与存储数据的原始网站一致。

三者比较起来:

  • Cookies:有限的存储空间,每次与服务器交互时都会被发送,适合存储需要服务器知道的信息。

  • Local Storage:较大的存储空间,仅在客户端保存,适合存储不需要经常变更的本地数据。

  • Session Storage:存储空间适中,但数据仅在单个会话中有效,适合临时存储敏感操

所以当我们连接到已经有数据存储的浏览器和新创建的浏览器,区别主要就在于这些已经存储好了的数据,了解这些我们就知道为什么我们在已经存储的浏览器访问之前已经登录过的网址是不需要再输入密码验证了的。

我们一般启动浏览器都是双击快捷方式,其实这就是一种指令的运行方式。我们可以打开我们的快捷方式,点击属性查看:

我们在终端输入这条指令起到的效果是一样的:

大家可以尝试,所以我们启动浏览器的方式有很多种,我们可以启动FirFox的时候开启Marionette 服务。Marionette 是用于远程控制 Firefox 的协议和接口,经常用于浏览器的自动化测试。Chorm也是一样,不过二者参数名称不同。通过以下这段代码可以实验:

!"D:\Mozilla Firefox\firefox.exe"  --marionette --marionette-port 2828

指定了 2828为Marionette 服务监听的端口号,然后我们要让geckodriver.exe也就是火狐的驱动连接到该端口:

geckodriver.exe --connect-existing --marionette-port 2828

我们还可以在终端输入指令

netstat -ano|findstr "4444"

可以看到我们监听的端口:

接下来我们就可以通过selenium来连接这个端口了,这里需要注意的是selenium版本的问题,Selenium 3.x 可能不支持连接到已经打开的浏览器实例。这个功能主要在 Selenium 4.x 中通过对 Service 类的使用而得到支持。但是3.x的谷歌浏览器可以做到,火狐是做不到的。Marionette驱动程序不再适用于FF版本53和Selenium 3.5或更高版本,如果selenium高于这个版本可以用谷歌浏览器,不然会出现selenium.common.exceptions.TimeoutException: Message: 由于目标计算机积极拒绝,无法连接。 (os error 10061)错误。

谷歌浏览器指令为:

"chrome.exe" --remote-debugging-port=9222 --user-data-dir="user_path"

一定要指定存储浏览器数据的目录"user_path",端口默认为9222。

链接浏览器

1.谷歌浏览器

如果是谷歌浏览器开放的端口的话:

from selenium import webdriver
from selenium.webdriver.chrome.options import Options

options = Options()
options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")

# 确保您的 chromedriver 路径是正确的
driver = webdriver.Chrome( options=options)

 

连接完毕后就可以自行操作了。

2.火狐浏览器

from selenium import webdriver
from selenium.webdriver.firefox.options import Options

# 创建一个新的Firefox选项对象
options = Options()

# 连接到已经存在的Firefox实例
driver = webdriver.Remote(command_executor="http://localhost:4444", options=options)

如果火狐出现问题多半是你selenium的版本不匹配,看我上一节点的末尾,有写清楚情况。那么以上基本就可以实现了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1420727.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【活动回顾】CMeet 成都:转鸿蒙 对应用开发来说是否是职业发展新机会 - 圆满结束!

文章目录 前言一、活动介绍二、精彩分享内容及活动议程2.1、《COC 成都社区情况和活动介绍》2.2、“匿”问我答,现场互动2.3、《话题一:升职加薪》2.4、《话题二:说说鸿蒙》2.5、2023 CSDN 1024 程序员节成都站贡献人物表彰2.6、《话题三&…

谁说后端不能画出美丽的动图?让我来给大家拜个年!

今天我们要介绍的是Python的内置库——小海龟(turtle),它是一个非常实用的绘画工具,不仅可以帮助我们绘制图形,还能让我们查看整个绘画过程。即使对绘画一窍不通的人也能够使用它来创作出生动、形象的gif动图。现在正是…

AIGC项目——Meta:根据对话音频生成带动作和手势的3d逼真数字人

From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations From Audio to Photoreal Embodiment:Synthesizing Humans in Conversations 从二元对话的音频中,我们生成相应的逼真的面部、身体和手势。 概括性:角色是由作者的声音驱动的(而不是模…

【获奖必看2.0】美赛小技巧之一秒输入一个公式

大家好呀,美赛开赛还有四天的时间,今天给大家带来的是美赛论文写作时非常实用的一个小技巧——快速输入任何复杂公式。 相信很多小伙伴在论文写作的时候都有一个小烦恼,那就是在面对比较复杂的公式的时候,应该怎么进行快速输入呢…

12.2 关键点提取——SIFT

一、理论 文章看了以下博文:Sift中尺度空间、高斯金字塔、差分金字塔(DOG金字塔)、图像金字塔-CSDN博客 该文章对SIFT写的很详细,所以在这里我直接抄过来作为笔记。如果以后作者变为付费文章可以提醒我删除。 1.图像金字塔 图像…

酒店|酒店管理小程序|基于微信小程序的酒店管理系统设计与实现(源码+数据库+文档)

酒店管理小程序目录 目录 基于微信小程序的酒店管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、管理员模块的实现 (1) 用户信息管理 (2) 酒店管理员管理 (3) 房间信息管理 2、小程序序会员模块的实现 (1)系统首页 &#xff0…

Spring Boot + security + jwt 测试安全策略

一、测试概述 主要目的是测试security的用法。因测试搭建mysql和redis比较麻烦,所以我这里将自定义的jwt和用户信息缓存到程序的内存中。 本人测试的项目比较混乱,Spring Boot父类只标出有用的依赖。其子类用的版本为jdk11。后续会继续深入oauth2&#x…

微服务-微服务Alibaba-Nacos注册中心实现

1. 系统架构的演变 俗话说, 没有最好的架构,只有最合适的架构。 微服务架构也是随着信息产业的发展而出现的最有普 遍适用性的一套架构模式。通常来说,我们认为架构发展历史经历了这样一个过程:单体架构——> 垂直架构 ——&g…

Java后端须知的前端知识

Java后端须知的前端知识 HTML &#xff08;超文本标记语言&#xff09; W3C标准 结构&#xff1a;HTML表现&#xff1a;CSS行为&#xff1a;JavaScript 快速入门 <html><head><title></title></head><body><font color"red&q…

【linux】复制cp和硬连接、软连接的区别? innode 关系?

1.命令&#xff1a; cp -r [源文件或目录] [目的目录] #复制 ln -s [被链接的文件] [链接的目录/名称] #软连接 ln [被链接的文件] [链接的目录/名称] #硬连接 注&#xff1a;cp -r 会把所有source当作普通文件&#xff08;regular文件&#xff09;&#x…

vue3.0 + 动态加载组件 + 全局注册组件

首先 vue 动态加载组件使用的是 component 标签&#xff0c;并通过设置组件的is 属性来指定要渲染的组件。例如&#xff1a; <component :is"currentComponent"></component>其中&#xff0c;currentComponent 是一个变量&#xff0c;它的值可以是以下几…

BP图片降噪MATLAB代码

BP(Back Propagation)神经网络是一种常用的深度学习模型,可以用于图像降噪。主要步骤包括: 构建BP神经网络模型。包括输入层、隐藏层和输出层。输入层大小与图像大小相同,输出层大小也与输入图像大小相同。隐藏层根据图像复杂度设定。 准备训练数据。使用干净图像作为输入,加…

数字图像处理(实践篇)三十八 OpenCV-Python实现ORB特征检测实践

​ 目录 一 涉及的函数 二 实践 ​ ORB(Oriented FAST and Rotated BRIEF)是一种特征点检测和描述算法,它结合了FAST关键点检测和BRIEF描述子。ORB算法具有以下优势: ①实时性:能够在实时应用中进行快速的特征点检测和描述。

基于Vue uniapp和java SpringBoot的汽车充电桩微信小程序

摘要&#xff1a; 随着新能源汽车市场的迅猛发展&#xff0c;汽车充电桩的需求日益增长。为了满足市场需求&#xff0c;本课题开发了一款基于Java SpringBoot后端框架和Vue uniapp前端框架的汽车充电桩微信小程序。该小程序旨在为用户提供一个简洁高效的充电服务平台&#xff0…

【pytest系列】- assert断言的使用

&#x1f525; 交流讨论&#xff1a;欢迎加入我们一起学习&#xff01; &#x1f525; 资源分享&#xff1a;耗时200小时精选的「软件测试」资料包 &#x1f525; 教程推荐&#xff1a;火遍全网的《软件测试》教程 &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1…

海外云手机运营Instagram攻略

Instagram是世界著名的社交媒体平台&#xff0c;有着10亿实时用户&#xff0c;是跨境电子商务的优质流量来源。平台以女性用户为主&#xff0c;购物倾向高&#xff0c;转化率好。它被公认为外贸行业的优质社交媒体流量池。那么&#xff0c;如何使用海外云手机吸引Instagram上的…

Spring cloud智慧工地信息平台管理系统源码

目录 报警统计 实时报警列表 工程进度 劳务信息 隐患信息 施工安全管理 人员证书管理 专项安全方案 安全方案审批 隐患排查管理 安全检查统计 危险源Top10 整改超时预警 检查问题数量统计 安全隐患趋势 安全日志管理 视频监控查看 视频回放 AI危险源识别 AI应用总览 AI设备 机械…

【Servlet】Smart Tomcat插件简化Servlet开发流程及解决常见问题

个人主页&#xff1a;兜里有颗棉花糖 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 兜里有颗棉花糖 原创 收录于专栏【Servlet】 本专栏旨在分享学习Servlet的一点学习心得&#xff0c;欢迎大家在评论区交流讨论&#x1f48c; 目录 一、Smart Tomcat插件二…

Kotlin快速入门系列2

Kotlin的基本数据类型 Kotlin 的基本数值类型包括 Byte、Short、Int、Long、Float、Double 等。不同于 Java 的是&#xff0c;字符不属于数值类型&#xff0c;是一个独立的数据类型。 Java和kotlin数据类型对照如下&#xff1a; Java基本数据类型 Kotlin对象数据类型 数据类…

深度强化学习(王树森)笔记08

深度强化学习&#xff08;DRL&#xff09; 本文是学习笔记&#xff0c;如有侵权&#xff0c;请联系删除。本文在ChatGPT辅助下完成。 参考链接 Deep Reinforcement Learning官方链接&#xff1a;https://github.com/wangshusen/DRL 源代码链接&#xff1a;https://github.c…