【已解决】使用selenium启动谷歌Chrome浏览器打开指定网站，页面空白，而使用其它浏览器手动打开该网站则正常

news2025/4/19 14:57:15

问题描述

1、在使用python实现自动化网络爬虫时，我使用到selenium来驱动谷歌Chrome浏览器来打开某一个网页，然后爬取数据，代码如下：


from selenium import webdriver
import time


driver = webdriver.Chrome()
driver.get('https://klatasds.ecnu.edu.cn/xydt/list.htm')

time.sleep(5)
print(driver.page_source)

2、但是当执行到driver.get(url)访问网站时，页面是空白的，如下所示，没有正常显示该网站的数据

print输出的网页html也只有如下数据：

<html><head></head><body></body></html>

3、而我将该url网址收到复制到其他浏览器中访问是正常的，可以看到网页数据，说明这个网址是没有问题的。

原因分析：

既然手动复制到其他浏览器可以正常访问，排除网址和网络的问题，手动另起一个Chrome浏览器，复制访问该网站还是OK的，而且换成访问百度首页，也是可以的，说明不是Chromedriver和浏览器版本的问题。

因此，应该是该网站被反爬了，这个反爬是监测到我们使用了selenium自动化浏览器后就不返回数据在浏览器中显示。

我们在使用selenium打开浏览器后，会看到一行文字：显示浏览器正收到自动化软件的控制：

selenium启动的浏览器与手动打开的浏览器的浏览器指纹是不一样的，所以能够被网站检测到。

而浏览器指纹，大家比较熟悉就是window.navigator.webdriver属性，如果是在selenium打开的浏览器，其结果为true，而正常浏览器结果为undefined。我们可以复制这个值到浏览器中试试：

打开一个普通的浏览器，F12，控制台，输入window.navigator.webdriver：

由selenium打开一个浏览器，F12，控制台，输入window.navigator.webdriver：

当然，浏览器的指纹不止这一个属性，还有其他的属性。网站监测是否是selenium启动的判断方法具体根据哪些浏览器指纹判断的不得而知。

解决方案：

1、修改window.navigator.webdriver属性值，让其返回值为undefined
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
            "source": """
            Object.defineProperty(navigator, 'webdriver', {
              get: () => undefined
            })
            """
        })
driver.get('https://klatasds.ecnu.edu.cn/xydt/list.htm')
2、如果上述方法不行，使用undetected_chromedriver库

（1）pip install undetected_chromedriver

如果安装找不到，使用-i 参数更换pip安装源试试

（2）修改代码
import undetected_chromedriver as wd
import time
driver = wd.Chrome()
driver.get('https://klatasds.ecnu.edu.cn/xydt/list.htm')

time.sleep(5)
要注意使用undetected_chromedriver ，Chrome浏览器必须更新到最新的版本，否则会报错。

     我最后是使用第2中方法成功解决了我的问题

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/557433.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【已解决】使用selenium启动谷歌Chrome浏览器打开指定网站，页面空白，而使用其它浏览器手动打开该网站则正常

问题描述

相关文章

基于JavaSpringBoot+Vue+uniapp实现微信小程序新闻资讯平台

多模态大模型时代下的文档图像智能分析与处理

＜SQL＞《SQL命令（含例句）精心整理版（2）》

案例17：Java代驾管理系统设计与实现开题报告

类的加载过程

linux命名管道总结

一篇文章告诉你什么是Java内存模型

一图看懂 click 模块：一个通过组合的方式来创建精美命令行界面的包，资料整理+笔记（大全）

Python篇——数据结构与算法（第一部分）

【远程访问】Linux搭建SVN服务器，并内网穿透实现公网远程访问

C++入门预备语法

【AUTOSAR】【以太网】SomeIpTp

知识付费：创客匠人的发展转型之路

案例19：Java私房菜定制上门服务系统设计与实现开题报告

小型双轮差速底盘实现红外避障功能

VS2022 CUDA环境配置

19 # promisify：将回调方法 promise 化

Linux基于Apache服务搭建简易镜像站

深度学习 - 50.推荐场景下的 Attention And Multi-Head Attention

如何用FinalShell连接VirtualBoxLinux虚拟机？