Selenium:设置元素等待、上传文件、下载文件

news2024/9/20 0:24:46

前言:在工作和学习selenium自动化过程中记录学习知识点,深化知识点

1. 设置元素等待

元素定位之元素等待--

WebDriver提供了两种类型的等待:显示等待和隐式等待。

1.1 显示等待

显式等待使WebDriver等待某个条件处理时继续执行,否则在达到最大时长时抛弃超时异常(TimeoutException)。


from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC wd = webdriver.Chrome() wd.get('https://www.baidu.com/') a = WebDriverWait(wd,10).until(EC.presence_of_element_located((By.ID,"kw"))) a.send_keys('selenium')

WebDriverWait类是由WebDriver提供的等待方法。在设置时间内,默认每隔一段时间检测一次当前页面元素是否存在,如果超过设置时间检测不到则抛出异常。

WebDriverWait(driver, timeout, poll_frequency=POLL_FREQUENCY, ignored_exceptions=None)

driver:浏览器驱动
timeout:最长超时时间,默认以秒为单位
poll_frequency:检测的间隔(步长)时间,默认为0.5S
ignored_exceptions:超时后的异常信息,默认情况下抛NoSuchElementException异常

WebDriverWait()一般和until()或until_not()方法配合使用。

until(method, message='')

调用该方法提供的驱动程序作为一个参数,直到返回值为True。

until_not(method, message='')

调用该方法提供的驱动程序作为一个参数,直到返回值为False。

在上面那个例子中,通过as关键字将expected_conditions重命名为EC,并调用presence_of_element_located()方法判断元素是否存在。

expected_conditions类提供的预期条件判断的方法如下所示:

title_is:判断当前页面的标题是否等于预期
title_contains:判断当前页面的标题是否包含预期字符串
presence_of_element_located:判断元素是否被加在 DOM树里,并不代表元素一定可见
visibility_of_element_located:判断元素是否可见(可见代表元素非隐藏,并且元素的宽和高都不等于0)
visibility_of:与上一个方法作用相同,只是上一个方法参数为,该方法接收的参数为定位后的元素
presence_of_all_elements_located:判断是否至少有一个元素存在于DOM树中。例如,在页面中有n个元素的class为“wp”,那么只要有一个存在就返回True
text_to_be_present_in_element:判断某个元素中的text是否包含了预期的字符串
text_to_be_present_in_element_value:判断某个元素的value属性是否包含了预期的字符串
frame_to_be_available_and_switch_to_it:判断该表单是否可用切换进去,如果可用,返回True并且switch进去,否则返回False
invisibility_of_element_located:判断某个元素是否不存在于DOM树或不可见
element_to_be_clickable:判断元素是否可见并且是可以点击的
staleness_of:等到一个元素从DOM树中移除
element_to_be_selected:判断某个元素是否被选中,一般用在下拉列表
element_selection_state_to_be:判断某个元素的选择状态是否符合预期
element_located_selection_state_to_be:与上一个方法作用相同,只是上一个方法参数为单位后的元素,该方法接收的参数为定位
alert_is_present:判断页面上是否存在alert

除expected_conditions所提供的丰富的预期条件判断方法外,还可以使用is_displayed()方法来判断元素是否可见。


from selenium import webdriver from time import sleep,ctime wd = webdriver.Chrome() wd.get('https://www.baidu.com/') print(ctime()) for i in range(10): try: el = wd.find_element_by_id("kw22") if el.is_displayed(): break except:pass sleep(1) else: print("time out") wd.close() print(ctime())

相对来说,这种方式更容易理解,通过for循环10次,每次循环判断元素的is_displayed()状态是否为True。如果为True,则break跳出循环;否则sleep(1)后继续循环判断,直到10次循环结束后,打印“time out”信息。

执行结果如下:

1.2 隐式等待

隐式等待是通过一定的时长等待页面上某元素加载完成。如果超出了设置的时长元素还没有被加载,则抛出NoSuchElementException异常。WebDriver提功力implicitly_wait()方法来实现隐式等待,默认设置为0。它的用法相对来说要简单得多。


from selenium import webdriver from selenium.common.exceptions import NoSuchElementException from time import ctime wd = webdriver.Chrome() #设置隐式等待为10秒 wd.implicitly_wait(10) wd.get('https://www.baidu.com/') try: print(ctime()) wd.find_element_by_id("kw22").send_keys('selenium') except NoSuchElementException as e: print(e) finally: print(ctime())

Implicitly_wait()默认参数的单位为秒,本例中设置等待时长为10秒。首先这10秒并非一个固定的等待时间。它并不影响脚本的执行速度。其次,它并不针对页面上的某一个元素进行等待。当脚本执行到某个元素定位时,如果元素可以定位,则继续执行;如果元素定位不到,则它将以循环查询的方式不断地判断元素是否被定位到。假设在第3秒定位到了元素,则继续执行,若知道超出设置时长(10秒)还没有定位到元素,则抛出异常。

在上面的例子中,显然百度输入框的定位id=kw22是有误的,通过打印的两次时间可以看出,当执行对百度输入框的操作时,超过了10秒的等

1.3 sleep休眠方法

在前面我们就使用过sleep方法了,只不过没有详细的介绍,现在就把这个归入到这个大标题中来介绍下。

有时候我们希望脚本在执行到某一个位置时做固定时间的休眠,尤其是在脚本调试中。这时可以使用sleep()方法,需要说明的是,sleep()方法由python的time模块提供。


from selenium import webdriver from time import sleep wd = webdriver.Chrome() wd.get('https://www.baidu.com/') sleep(2) wd.find_element_by_id("kw").send_keys("selenium") wd.find_element_by_id("su").click() sleep(5) wd.quit()

当执行到sleep()方法时会固定休眠一定的时长,然后再继续执行。sleep()方法默认参数以秒为单位,如果设置时长小于1秒,则可以用小数表示,如果sleep(0.5)表示休眠0.5秒。

2. 上传文件

上传文件是比较常见的Web功能之一,但WebDriver并没有提供专门用于上传的方法,如何实现上传操作关键在于上传文件的思路。

一般Web页面的上传功能的操作需要点击“上传”按钮后打开本地的Window窗口,从窗口中选择本地文件进行上传。而WebDriver是无法操作Windows控件的,所以,对于初学者来说,一般思路会卡在如何识别Window控件这个问题上。

对于Web页面的上传功能实现一般有一下两种方式。

普通上传:普通的附件上传是将本地文件的路径作为一个值放在input标签中,通过form表单将这个值提交给服务器。
插件上传:一般是指基于Flash、JavaScript或Ajax等技术所实现的上传功能。

插件上传不适合放在自动化里面讲解,可能会放在python高级编程里面讲解。对于通过input标签实现的上传功能,可以将其看作是一个输入框,通过send_keys()指定本地文件路径的方式实现文件上传。

html代码:


<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title></title> </head> <body> <div class="row-fluid"> file:<input type="file" name="file" /> </div> </body> </html>

通过浏览器打开,效果如下图所示:


from selenium import webdriver wd = webdriver.Chrome() wd.get('http://127.0.0.1:8020/day01/index.html') #定位上传按钮,添加本地文件 wd.find_element_by_name("file").send_keys('E:\1.png')

通过这种方法上传,就避免了操作Windows控件的步骤。如果能找到上传的input标签,那么基本上就可以通过send_keys()方法向其输入一个文件地址来实现上传。

3. 下载文件

WebDriver允许我们设置默认的文件下载路径,也就是说,文件会自动下载并且存放到设置的目录中。下面以谷歌浏览器为例,执行文件的下载。


from selenium import webdriver import os options = webdriver.ChromeOptions() prefs = {'profile.default_content_settings.popups':0,'download.default_directory':'E:\'} options.add_experimental_option('prefs',prefs) wd = webdriver.Chrome(executable_path=r'E:webdriverschromedriver.exe',chrome_options=options) wd.get('')#输入要下载的文件所在网页 wd.find_element_by_xpath('').click()#点击文件所在位置的元素

download.default_directory:指定路径
profile.default_content_settings.popups:0 为屏蔽弹窗,1 为开启弹窗

不同的浏览器设置方法也不同,以上例子值针对谷歌浏览器。火狐浏览器的下载设置就是其他类型的方法了。

 最后感谢每一个认真阅读我文章的人,看着粉丝一路的上涨和关注,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走! 希望能帮助到你!【100%无套路免费领取】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2118673.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mycat双主高可用架构部署-mycat安装

MySQL5.7服务器IP是192.168.31.209及192.168.31.210 1、安装Java运行环境 ELK搭建日志平台里面有Java安装&#xff0c;同样也可以采用yum安装 yum install -y java java -version 2、下载并解压mycat wget http://dl.mycat.org.cn/1.6.7.6/20220524101549/Mycat-server-1.…

支小宝来了!支付宝AI生活管家,让AI帮你“干活“

众所周知&#xff0c;支付宝界面越来越复杂&#xff0c;从最初的一个支付工具逐渐演变成了一个综合性的平台&#xff0c;涵盖了生活中的各个方面。 功能的增加的同时不可避免的就会导致使用不便。 随着大模型的应用&#xff0c;支付宝基于百灵大模型推出了“支小宝”AI生活管家…

盘点4款比pr剪辑简单的视频剪辑工具。

PR剪辑软件对于很多不太懂剪辑的人来说确实有点不太好操作&#xff0c;需要去学习一些剪辑知识使用比较好。如果想要在短时间内掌握一些剪辑技巧&#xff0c;可以选择相对简单一点的剪辑工具。比如下面这4款&#xff0c;不管是新手还是会剪辑的人都可以使用。 1、福昕高效剪辑 …

超有趣,小白专用的python基础到大师人工智能教程!

2017年7月&#xff0c;国务院发布的《新一代人工智能发展规划》提出&#xff0c;要在中小学阶段设置人工智能相关课程&#xff0c;并逐步推广编程教育。 Python 是一种通用型编程语言&#xff0c;它具有良好的可扩展性和适应性&#xff0c;易于学习&#xff0c;被广泛应用于云计…

适合Python练手的8个经典项目,有趣又实用,提升Python编程能力必看!

今天给大家分享的&#xff0c;是一些实战练习的小案例&#xff0c;如果你还是Python小白&#xff0c;可以再看看我前面几篇文章&#xff0c;如果是有了一点基础&#xff0c;那就尝试完成下面这些案例吧&#xff01; 这里插播一条粉丝福利&#xff0c;如果你在学习Python或者有…

阿卡迈 Akamai 逆向分析4 代码分拆3

阿卡迈函数解析10_获取EET数值.js // 这个值如果代码刷新了会变化 EHpvmPAvvbSFFBR7gXeSMA // 后续考虑如何自动化 window global Th \x1F\x0FBA\rw!6M\x03h6\x18\x18\x15\x05P8B3\rz\\\x06 //会变化// 直接在浏览器copy出来的值错误\n会解析错误 // Th "BA\n"…

用户缓冲区

目录 1. 引入问题2. 用户缓冲区2.1 解答上述问题2.2 缓冲区刷新策略 3. 全缓冲案例 1. 引入问题 // 输出信息带换行&#xff0c;调用完后close(1) int main() { const char* s1 "this is fwrite\n"; …

数据手套横向对比:4款手套哪款适合您?

数据手套是与虚拟物体交互、记录手部动作以及制作手部动画的重要工具。数据手套根据类别可分为只传输动作数据的数据手套&#xff0c;拥有触觉震动反馈的触觉手套&#xff0c;带有外骨骼的力反馈手套等。这些手套根据功能性的不同可分别应用于不同行业之中&#xff0c;在本文中…

【项目功能扩展】在线网站 -用户管理功能(用户注册登录修改等、利用cookie存储用户会话状态)

文章目录 0. 前言开发环境 & 涉及技术 1. 宏观结构2. 后端部分① sqlite 管理类② user 管理类 3. 前端部分&#xff08;与后端交互&#xff09;① 登录② 注册③ 查看登录用户的信息④ 更新用户信息⑤ 登出用户 & 注销用户注意 效果演示 0. 前言 源码链接&#xff1a…

【Unity】简易而又实用的概率算法

1.两个数中任选一个&#xff08;抛硬币&#xff09; 基础版本&#xff1a; public int RandomBetweenTwoNumber(int a,int b) {float random Random.Range(0,1f);return radom<0.5f ? a : b ; } 升级版本&#xff08;支持概率调整&#xff09;&#xff1a; /*pa表示“…

并发编程:读写锁

一、ReentrantReadWriteLock 1.ReentrantReadWriteLock 是什么&#xff1f; ReentrantReadWriteLock 实现了 ReadWriteLock &#xff0c;是一个可重入的读写锁&#xff0c;既可以保证多个线程同时读的效率&#xff0c;同时又可以保证有写入操作时的线程安全。 public class …

CDGA|做好数据治理的几个策略,不看后悔

在当今这个数据驱动的时代&#xff0c;数据已成为企业最宝贵的资产之一。然而&#xff0c;随着数据量的爆炸性增长和来源的多样化&#xff0c;如何有效地管理和利用这些数据&#xff0c;即数据治理&#xff0c;成为了企业面临的重要挑战。 良好的数据治理不仅能够提升数据质量&…

中医世家龚洪海博士:用医术和真诚赢得患者的心

医生&#xff0c;可以说是世界上最伟大的人&#xff0c;他们以高超的医疗技术和崇高的职业道德&#xff0c;以患者为先&#xff0c;为患者带来生的奇迹&#xff0c;抚平患者的病痛&#xff0c;是生命忠诚的的捍卫者。明代御医龚廷贤龚氏传人龚洪海博士就是这样一个&#xff0c;…

英国数字化战略下的人工智能时代:挑战与发展机遇

文章目录 前言一、英国数字化转型初探二、数字化转型重点举措1、 供应链2、金融市场3、数字基础设施4、科学研究5、数字技术赋能绿色转型6、数字包容性7、国际合作:重视与发展中国家合作8、完善数字民主建设三、战略启示前言 后疫情时代,英国正面临包括首相更迭频繁导致的内…

AnyGPT:多模态语言模型,任意处理语音、图像和音乐

人工智能咨询培训老师叶梓 转载标明出处 大模型的能力大多局限于文本处理&#xff0c;而现实世界环境本质上是多模态的&#xff0c;涉及视觉、语言、声音和触觉等多种感知渠道。为了使LLM能够更好地模拟人类的多模态感知能力&#xff0c;复旦大学的研究团队提出了AnyGPT&#x…

巴西美客多广告打法,这样开广告有泼天的流量!

听说做巴西美客多本土店不需要开广告就有流量&#xff1f;这是真的吗&#xff1f;相信这对于一直在做欧美市场的卖家来说&#xff0c;简直是不敢相信&#xff0c;What? 有运营巴西美客多本土店铺多年的卖家说&#xff0c;确实是不开广告也能获得不错的流量&#xff0c;过去几…

汽车EDI:montaplast EDI对接

Montaplast 是一家总部位于德国的全球知名汽车零部件供应商&#xff0c;专注于高精度塑料部件的设计、开发和生产。公司成立于1958年&#xff0c;主要为汽车行业提供轻量化、高性能的塑料解决方案。Montaplast 以其在注塑成型技术、表面处理和装配技术方面的专业能力而著称&…

vue3 项目中使用git

一.vue项目创建 二.创建本地仓库并和远程仓库进行绑定 在vue3-project-git 项目文件夹下 初始化一个新的Git仓库&#xff0c;可以看到初始化成功之后就会出现一个.git文件&#xff0c;该文件包含所有必要的 Git 配置和版本控制信息。 创建远程仓库: 打开gitee ,点击右上角 ‘…

电源模块检测方法之功率因数的测量

在设计和维护电源系统时&#xff0c;功率因数是一个不可忽视的参数。那么功率因数是什么呢&#xff1f;怎么测试电源模块的功率因数呢&#xff1f;又该如何提高功率因数呢&#xff1f;让我们一起来探讨吧。 一、功率因数概述 功率因数是指交流电路中有功功率和视在功率的比值&a…

安全产品概述

防火墙 防火墙的核心功能是过滤掉有害的流量&#xff0c;在专用网络和公共网络之间建立保护屏障。防火墙过滤通常基于一系列规则&#xff0c;如 IP 地址、域名、协议、端口号、关键字等&#xff0c;对入站和出站的流量进行过滤。这些规则也称为访问控制列表&#xff08;ACCESS…