selenium查找网页如何处理网站资源一直加载失败的情况
selenium获取一个网页,某个网页的资源卡了很久还没有加载成功,如何放弃这个卡的数据,继续往下走
有2钟方式。通常可以采用下面的方式一来处理这种情况
方式一、WebDriverWait
这种方式对于资源比较多比较复杂的网页比较合适,比如有些图片在国外,一直加载不出来。mail.com就是这样
当网页15秒还没有加载完成,此时代码不管有没有找到元素都会继续往下走
,:
- 如果没有找到元素就会抛异常。
- 如果找到元素,就会点击
这个时候,如果抛异常。可以多尝试即便,直到不抛异常即可继续往下走
def ClickElementByXpath(self, brower, xPath):
try:
brower.implicitly_wait(5)
self.insert_text_to_last_line(self.log_pass_file, xPath)
result = WebDriverWait(brower, 15).until(EC.presence_of_element_located((By.XPATH, xPath)))
result.click()
return True
except Exception as e:
print('exception timeout!!!')
return False
方式二、find_element
这种方式适合资源能快速加载完成的网站。
find_element会等到网站所有的资源全部加载完成后,再继续往下执行,这样的话更稳定,但对于有些网站资源本身很卡,就会一直卡住了,导致卡非常久,最后脚本运行失败。
def ClickElementByXpath(self, brower, xPath):
try:
brower.implicitly_wait(55)
self.insert_text_to_last_line(self.log_pass_file, xPath)
#element_input = brower.find_element_by_xpath(xPath)
element_input = brower.find_element(By.XPATH, xPath)
element_input.click()
return True
except Exception as e:
print('exception timeout!!!')
return False
如何实现对元素的点击后,不等页面加载完成,接着往下走
在Selenium中,通常情况下,点击元素后会等待页面加载完成,以确保可以与新加载的内容进行交互。不过,如果你希望在点击元素后不等待页面加载完成,而是立即继续执行后续操作,你可以考虑使用execute_script
方法执行JavaScript代码来模拟点击,并在后续操作中处理页面加载。
以下是一个示例,演示如何点击一个元素后不等待页面加载完成,而是继续执行后续操作:
from selenium import webdriver
# 创建 WebDriver 实例
driver = webdriver.Chrome()
# 打开网页
driver.get("https://example.com")
# 找到要点击的元素
element = driver.find_element_by_id("my_element_id")
# 使用 JavaScript 模拟点击
driver.execute_script("arguments[0].click();", element)
# 在这里可以继续执行后续操作,而不用等待页面加载完成
# 关闭 WebDriver
driver.quit()
在上述示例中,我们使用execute_script
方法来执行JavaScript代码,将点击操作模拟在元素上。随后,你可以立即继续执行后续操作,而不需要等待页面加载完成。
请注意,这种方法可能会导致在页面尚未加载完全时进行交互,可能会引发一些问题,具体取决于网页的结构和行为。因此,你需要根据具体情况来确定是否适合采用这种方式。如果页面加载的内容对后续操作有影响,你可能需要在点击后等待一段时间,以确保页面的重要部分已加载完成。
是否可以设置超时时间 当元素的点击后 ,不等页面加载完成,接着往下走
在Selenium中,可以使用WebDriver
的set_page_load_timeout
方法来设置页面加载的超时时间,但是这个设置通常是应用于整个页面的加载,而不是单个元素的点击操作。如果你希望在点击元素后不等待页面加载完成,而是继续执行后续操作,可以采取以下方法:
使用set_page_load_timeout
:你可以设置一个较短的页面加载超时时间,以便在点击元素后等待较短的时间。然后,可以在捕获超时异常后,继续执行后续操作。
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
# 创建 WebDriver 实例
driver = webdriver.Chrome()
# 设置页面加载超时时间为5秒
driver.set_page_load_timeout(5)
try:
# 打开网页
driver.get("https://example.com")
# 找到要点击的元素
element = driver.find_element_by_id("my_element_id")
# 点击元素
element.click()
except TimeoutException:
print("页面加载超时")
# 在这里可以继续执行后续操作,而不用等待页面加载完成
# 关闭 WebDriver
driver.quit()