Selenium与WebDriver:Errno 8 Exec格式错误的多种解决方案

news2024/9/9 7:28:00

亿牛云爬虫代理.png

概述

在使用Selenium和WebDriver进行网页自动化时,可能会遇到各种错误。其中一个常见问题是执行格式错误(Errno 8 Exec format error)。这个错误通常在运行ChromeDriver时出现,错误提示涉及路径中的某个文件,如THIRD_PARTY_NOTICES.chromedriver。本文将概述这个问题的背景,并提供多种解决方案,包括如何使用代理IP技术进行数据抓取。

细节
问题描述

执行格式错误通常出现在用户尝试运行ChromeDriver的过程中。例如,用户可能会看到如下错误信息:

Errno 8 Exec format error: /Users/[USER]/.wdm/drivers/chromedriver/mac64/127.0.6533.72/chromedriver-mac-arm64/THIRD_PARTY_NOTICES.chromedriver

这种错误通常与ChromeDriver的兼容性问题或路径配置问题有关。

解决方案

以下是几种解决这个问题的有效方法:

  1. 手动更改路径
    尝试手动更改d_path路径,将THIRD_PARTY_NOTICES.chromedriver替换为chromedriver,但这种方法不一定能解决所有问题。
  2. 更新webdriver-manager
    许多用户发现更新webdriver-manager包至最新版本(例如4.0.2)可以解决此问题。可以通过以下命令更新:
pip install --upgrade webdriver-manager
  1. 重新安装webdriver-manager
    重新安装webdriver-manager并删除drivers.json文件中的最后一条记录:
pip uninstall webdriver-manager
pip install webdriver-manager
  1. 下载特定版本的ChromeDriver
    直接下载所需版本的ChromeDriver可执行文件,并在代码中指定该文件的路径,而不是使用webdriver-manager
  2. 修改driver_cache.py文件
    修改webdriver_manager/core/driver_cache.py文件以修复可能的路径问题。
使用爬虫代理IP技术的Selenium示例

在实际使用Selenium进行网页抓取时,代理IP技术可以帮助提高抓取效率。以下是一个使用代理IP的示例代码,参考了亿牛云爬虫代理的配置。

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.proxy import Proxy, ProxyType

# 代理IP配置 亿牛云爬虫代理加强版
proxy_ip = "代理IP地址" #www.16yun.cn
proxy_port = "端口号"
proxy_username = "用户名"
proxy_password = "密码"

# 配置代理
proxy = Proxy()
proxy.proxy_type = ProxyType.MANUAL
proxy.http_proxy = f"http://{proxy_username}:{proxy_password}@{proxy_ip}:{proxy_port}"
proxy.ssl_proxy = f"http://{proxy_username}:{proxy_password}@{proxy_ip}:{proxy_port}"

capabilities = webdriver.DesiredCapabilities.CHROME
proxy.add_to_capabilities(capabilities)

# 设置Chrome选项
options = webdriver.ChromeOptions()
options.add_argument("--headless")
options.add_argument("--no-sandbox")
options.add_argument("--disable-dev-shm-usage")

# 安装并配置ChromeDriver
d_path = ChromeDriverManager().install()
driver_service = Service(d_path)
driver = webdriver.Chrome(service=driver_service, options=options, desired_capabilities=capabilities)

# 测试访问一个网站
driver.get("http://www.example.com")
print(driver.page_source)

# 关闭浏览器
driver.quit()

在上面的代码中,配置了代理IP,并将其添加到Selenium的能力设置中。这样可以使用亿牛云爬虫代理进行网页抓取,有效绕过IP频繁的问题。

结论

本文介绍了在使用Selenium和WebDriver时可能遇到的执行格式错误问题,并提供了多种解决方案。通过手动更改路径、更新或重新安装webdriver-manager、下载特定版本的ChromeDriver以及修改相关配置文件,用户可以有效解决此问题。此外,结合代理IP技术,可以提高网页抓取的成功率和效率。希望这些方法能帮助到遇到类似问题的用户。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1963369.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WordPress建站教程:零基础新手小白如何B2B外贸建站

如果你想通过独立站拿询盘获取订单,那么必须先要有一个自己的网站,所以建站是你绕不过去的一件事。对于零基础的新手小白来说,如何从零开始搭建一个B2B外贸网站呢?本文将为你提供一份详细的WordPress建站教程,帮助你从…

NodeJS云观影应用系统-计算机毕业设计源码60580

摘 要 随着互联网与移动互联网迅速普及,网络上的电影娱乐信息数量相当庞大,人们对获取感兴趣的电影娱乐信息的需求越来越大,个性化的基于Vue框架实现云观影应用系统成为一个热门。然而电影信息的表示相当复杂,因此需要开发一个基于Vue框架实…

Navicat for MySQL 17 实现更明智的业务决策

5 月 12 日,Navicat 对现有产品进行了几项重大更新,包括 Navicat Premium、Navicat BI 和 Navicat Data Modeler。最受欢迎的 Navicat 工具之一,Navicat for MySQL,也得到了新的更新,获得了许多与 Navicat Premium 相同…

PostgreSQL——查询扫描介绍

顺序扫描 概述 顺序扫描(Sequential Scan)是PostgreSQL中一种基本的数据检索方式,它通过按顺序读取表中的所有页面来查找满足查询条件的记录。这种方式不依赖于索引,因此在某些情况下可能是唯一的选择,尤其是当表没有…

熵权法确定权重

熵权法(Entropy Weight Method, EWM)是一种在综合考虑各因素提供信息量基础上计算综合指标的数学方法,属于客观综合定权法,在确定权重时更有说服力。该方法主要根据各指标传递给决策者的信息量大小来确定权重。在信息论中&#xf…

AIGC diffusers文生图模型optimum量化使用案例

参考: https://github.com/huggingface/blog/blob/main/quanto-diffusers.md 安装 pip install optimum-quanto %pip install optimum使用 from optimum.quanto import freeze, qfloat8, quantize from diffusers import PixArtSigmaPipeline import torchpipeline = PixArt…

离线安装部署docker,内网离线安装部署docker,以及docker常用命令

1.下载docker的离线安装包 链接: https://pan.baidu.com/s/1beDBIYw-8IjJj5syGnHiZA 提取码: 8888 复制这段内容后打开百度网盘手机App,操作更方便哦 2.将二进制文件:docker-20.10.19.tgz 拖入服务器目录/home/admin/解压 tar -zxvf docker-20.10.19.…

喜讯 华焰天下荣获绿色低碳诚信企业、碳中和承诺示范单位、信用评价 AAA 级信用企业等系列证书

在推动可持续发展和构建诚信商业环境的道路上,华焰天下再次传来令人振奋的消息!近日,华焰天下凭借其在绿色低碳领域的卓越表现、坚定不移的碳中和承诺以及高度可靠的信用体系,成功荣获绿色低碳诚信企业、碳中和承诺示范单位、信用…

无人机技术已应用至地理测绘,Infortrend存储助力测绘数据

--高扩展保存海量无人机数据,高性能支持快速调取建模,数据安全也有免费的备份功能,实实在在好用的存储设备。

智能合约中approve函数详解

场景 这段时间很多小伙伴加我、都咨询到了一个类似的业务场景、 如下: 1、第一步业务里面调用授权函数approve 、给指定address2、第二步是由授权的address调用transferFrom转移给指定的接受地址。 案例DEMO如下(这里test2肯定是会执行失败的&#xff…

C语言典型例题19

《C程序设计教程(第四版)——谭浩强》 例题2.7 检查浮点型数据的舍去误差 C语言知识: 浮点数在C语言用有两个类型,有float和double类型,其中double类型的数据精度更高 解题思路: 可以将一个double类型的…

城市运管服平台:智慧城市的神经中枢

“城市运行管理服务平台”(简称“城市运管服平台”)作为现代城市治理的智慧核心,正以前所未有的方式重塑着城市管理与服务的面貌。本文旨在深度解析城市运管服平台的内涵、运作机制及其对推动智慧城市发展的重要意义。 城市运管服平台&#…

视频超压缩保持质量 ffmpeg

参考: https://x.com/mortenjust/status/1817991110544744764 基于 FFMpeg 的 H264 压缩标准,实现压缩 90% 的视频大小 在线体验地址: https://tools.rotato.app/compress ffmpeg命令执行 ffmpeg -i "C:\Users\loong\Downloads\屏幕录…

Vidu视频生成工具全球上线,注册即刻体验

生数科技,这家成立于2023年3月的年轻企业,其核心团队成员来自清华大学人工智能研究院。首席科学家朱军教授,曾在贝叶斯机器学习和多模态大模型领域取得多项原创性成果。Vidu的核心技术U-ViT架构,是全球首个将Diffusion与Transform…

# mongodb_基础到进阶 -- MongoDB 快速上手(四)

mongodb_基础到进阶 – MongoDB 快速上手(四) 一、MongoDB :文章评论 需求&表结构&技术选型 1、文章评论:需求分析 1)参考某头条的文章评论业务,文章示例参考:早晨空腹喝水&#xff…

功能强大的图片/pdf识别成文字的工具Umi-OCR

一、工具概述 操作系统:支持windows、Linux使用方法:图形化、命令行、http接口 二、功能特性 三、部署方式 1、windows 下载地址:Umi-OCR_文字识别工具 2、linux 推荐使用docker部署 》下载 Dockerfile mkdir Umi-OCR-Docker cd Umi-OC…

Overlay网络

Overlay 介绍 Overlay网络是将已有的物理网络(Underlay网络)作为基础,在其上建立叠加的逻辑网络,实现网络资源的虚拟化。 传统网络带来了以下一些问题: ● 虚拟机规模受 网络规格限制在传统二层网络环境下&#xff0…

某“新一线城市“前端面试,纯纯被恶心到了

一.起因 在boss上刷到的一个小小厂,收大四全年实习生(web前端),因为离家乡比较近,而且双非一本的学历以及入坑的时间没有太长(前端部分不到一年),想去那里看看形势,要求是笔试面试,当场给是否录用结果&…

WPS@文字文档插入的表格,对单元格填充底纹颜色时,有字的地方就填充不上 ,空白。

背景 在创建的WPS文字文档中,插入了一个表格,对表格的某些单元格需要填充底纹颜色 问题 问题如标题,“文字文档插入的表格,对单元格填充底纹颜色时,有字的地方就填充不上 ,空白”,直观如下图 解…

【Linux】-----进度条小程序

目录 前言 基本知识 Ⅰ、回车和换行 Ⅱ、缓冲区 两个有意思的现象 简单定义 刷新缓冲区 简易倒计时程序 进度条代码 多文件下makefile写法 一代(无任何场景) procs1.h代码 procs1.c代码 主函数main1.c 一代运行结果: 二代 (搭配下载场景) procs2.c代…