前言
Selenium是一个用于web自动化测试的框架,在使用Ajax请求数据的页面中,会出现 sign ,token等密钥,如果考虑去破解可能花费的精力较多,所以考虑借助使用Selenium框架来实现数据爬取。
Selenium 简介
1. 1,组件✨
它提供了以下web自动化测试组件:
- Selenium IDE,Firefox浏览器的一个插件,提供简单的脚本录制、编辑与回放功能;
- Selenium Remote Control (RC),是selenium 1 提供的组件,包含:Selenium
- Server(用于提供自动化测试服务)、Selenium Client(用于执行脚本);
- Selenium Grid,用于对测试用例集做分布式处理(并行),现已集成到selenium server中;
- WebDriver,Selenium2(包括Selenium3)抛弃了SeleniumRC,而是使用WebDriver。相比SeleniumRC,Webdriver 的API更容易理解和使用,可读性和可维护性也有较大提高。
因为后面我们的web自动化测试使用的是Selenium3(即WebDriver),这里对WebDriver做一下说明:
- Webdriver不依赖于任何测试框架,除了必要的浏览器驱动,无需启动其他进程,也不必像Selenium 1那样需要先启动服务;
- 设计模式:按照Server-Client的经典设计模式设计;
- Server端:可以是任意的浏览器,当脚本启动浏览器时,该浏览器就是Server,它的职责是处理Client发送的请求并做出响应;
- Client端:即我们的测试代码,测试代码发送HTTP请求给Server(即浏览器),Server接受请求,执行相应操作并返回结果;
不同的浏览器,WebDriver需要依赖对应的浏览器驱动(如chromedriver.exe)来转化浏览器的native调用,所以进行Selenium自动化时,需先下载对应的浏览器的驱动。
1. 2,特点✨
免费开源的自动化测试工具(框架)
- 支持多平台:windows、linux、MAC
- 支持多种浏览器:Chrome、Firefox、IE、Safari、Opera
- 支持多种开发语言: java、ruby、python、C、C#等
- 支持分布式执行测试用例集,即可并行执行测试
🌹一,Python+Selenium环境搭建
(1)下载python✨
建议下载python 3.x版本,官方已经停止对python 2.x版本维护更新。
windows版本官网下载地址:https://www.python.org/downloads/windows/
以安装Python 3.9.12为例,进入上面的网址,根据系统 (32/64位)选择,我这里选择下载64位的
点击进入到下图页面,根据自己的系统选择下载。
(2)安装python✨
双击下载好的文件,一路默认安装即可,这里注意勾选添加python至环境变量,这样就不需要后续再设置环境变量了。
先勾选最下方的选项,然后点击Customize installation,注意一定要勾选最下面一个选项,它可以自动帮你添加windows环境变量。点击完成后,进入下一个步骤:
默认全选就好,继续点击下一步:
记得勾选第一项,并选择自己想要安装的路径。然后点击Install后,等几分钟就好了。
(3)验证是否安装完成✨
cmd窗口输入命令:python,出现版本信息等则说明安装成功,且环境变量设置成功,如下:
如果在上一步中,未勾选添加python至环境变量,输入python命令后会提示:不是内部或外部命令,只需将python的安装路径添加至环境变量即可,具体添加方法可百度。
(4)安装Selenium✨
cmd窗口输入命令:pip install selenium,安装最新版本的selenium
我这安装过了会显示already已经存在了,查看一下selenium版本
安装完成后可以查看版本号,命令为:pip show selenium
🌹二,selenium启动Chrome浏览器
不同的浏览器,需要安装对应浏览器的Selenium驱动才能进行自动化测试。首先介绍Chrome浏览器。
(1)查看Chrome版本信息✨
- 没有安装Chrome浏览器,则需先安装(建议官方地址下载)
- 官方下载地址为:https://www.google.cn/chrome/
- 查看Chrome浏览器的版本。首先要查看当前安装的Chrome浏览器的版本,以便下载与浏览器版本对应的驱动文件,打开Chrome浏览器,点击菜单中的“帮助”→“关于Google Chrome”,即可查看Chrome的版本号
这的Chrome版本号为86.0.4240.111。
(2)下载驱动 chromedriver和配置✨
下载地址:http://chromedriver.storage.googleapis.com/index.html
也可以选择淘宝镜像下载,地址为:http://npm.taobao.org/mirrors/chromedriver/
低版本Chrome浏览器已经很少使用,就不做对应下载说明了。更新版本的Chrome浏览器(从70~87),只需根据自己电脑上安装的Chrome浏览器版本下载对应的chromedriver即可,如下:
选择好对应的chromedriver点击进入如下:
点击下载,下载完成后,解压该zip文件得到chromedriver.exe文件,将chromedriver.exe放置在python安装目录的Scripts中
点击进入解压生成的文件夹
复制文件放入python安装目录的Scripts文件夹中
注意:需要将解压出来的chromedriver.exe文件放置在Scripts中,而不是将解压得到的chromedriver文件夹放置在Scripts中,否则启动脚本时会报错。
(3)尝试selenium启动Chrome✨
尝试启动Chrome浏览器
import time
from selenium import webdriver
driver = webdriver.Chrome() # 启动浏览器
driver.get("https://www.baidu.com") # 打开某个网址
time.sleep(10)
driver.quit() # 关闭浏览器
能打开网址不报错则证明配置完成。
🌹三,selenium启动火狐浏览器(Firefox)
(1)查看火狐浏览器版本✨
打开火狐浏览器,点击右上角"菜单"按钮进行查看,步骤如下:
我这里的火狐浏览器版本为:82.0.2 (64 位)
(3)下载驱动 geckodriver✨
selenium 3 只支持Firefox 48及以上版本,且需下载驱动,所以配置如下:
Firefox 48 及以上版本,Selenium 3.X + FireFox驱动(geckodriver)
Firefox 47 及以下版本,Selenium 2.X,内置驱动,无需下载
geckodriver下载地址:https://github.com/mozilla/geckodriver/releases
我这里选择目前最新的版本下载(浏览器为64位),如下:
如果按照后续步骤不能启动浏览器,可以尝试删除该版本的geckodriver下载更低的版本的geckodriver。
下载后解压文件,将解压后得到的 geckodriver.exe 文件放置在python安装目录的Scripts中(同chromedriver.exe),如下:
(4)尝试启动火狐浏览器(Firefox)✨
import time
from selenium import webdriver
driver = webdriver.Firefox() # 启动浏览器
driver.get("https://www.baidu.com") # 打开某个网址
time.sleep(10)
driver.quit() # 关闭浏览器
启动Firefox浏览器并打开百度网址,如下:
🍁结语
🌌本章说的是关于python的配置及selenium的配置,感谢您的关注与支持!
👏声明:由于作者也在求学的路上知识水平有限,本文如有错误敬请读者能够指出错误!