自学Python第十八天-自动化测试框架(二):DrissionPage、appium
- DrissionPage
- 环境和安装配置
- 准备工作
- 简单的使用示例
- 控制浏览器
- 收发数据包
- 模式切换
- 浏览器模式
- 创建浏览器对象
- 访问页面
- 加载模式
- none 模式技巧
- 获取页面信息
- 页面交互
- 查找元素
- `ele()` 和 `eles()`
- `parent()` 、`child()` 和 `children()`
- `next()`、`nexts()` 和 `prev()`、`prevs()`
- `after()`、`afters()` 和 `before()`、`befores()`
- 匹配模式
- 查找语法
- 处理 frame
- 简化写法
- 获取元素信息
- 元素交互
- appium
DrissionPage
由于 selenium 的缺点过多,pyppeteer 使用较为复杂,也可以使用 DrissionPage 库来进行自动化测试。
DrissionPage 官方文档
DrissionPage 的优点有:
- 极简的语法规则,定位元素更加容易
- 无处不在的等待和自动重试功能,使得容错能力大大增加
- 允许反复使用已经打开的浏览器,方便调试
- 把 iframe 看作普通元素,无需切入切出,可以直接查找内容
- 良好的异步支持
环境和安装配置
DrissionPage需要的环境为:
- 操作系统:Windows、Linux 或 Mac。
- python 版本:3.6 及以上
- 支持浏览器:Chromium 内核(如 Chrome 和 Edge)
使用 pip 安装 DrissionPage:
pip install DrissionPage
DrissionPage 包含三种主要页面类。根据需要在其中选择使用。
- 如果只要控制浏览器,导入
ChromiumPage
。from DrissionPage import ChromiumPage
- 如果只要收发数据包,导入
SessionPage
。from DrissionPage import SessionPage
WebPage
是功能最全面的页面类,既可控制浏览器,也可收发数据包。from DrissionPage import WebPage
另外 DrissionPage 还有一些配置工具类
类名 | 描述 | 引入方式 |
---|---|---|
ChromiumOptions | 用于设置浏览器启动参数。这些参数只有在启动浏览器时有用,接管已存在的浏览器时是不生效的。 | from DrissionPage import ChromiumOptions |
SessionOptions | 用于配置SessionPage或WebPages 模式的连接参数。 | from DrissionPage import SessionOptions |
Settings | 用于设置全局运行配置,如找不到元素时是否抛出异常等。 | from DrissionPage.common import Settings |
Keys | 键盘按键类,用于键入 ctrl、alt 等按键。 | from DrissionPage.common import Keys |
Actions | 动作链,用于执行一系列动作。在浏览器页面对象中已有内置,无如特殊需要无需主动导入。 | from DrissionPage.common import Actions |
By | 与 selenium 一致的By类,便于项目迁移。 | from DrissionPage.common import By |
wait_until | 可等待传入的方法结果为真 | from DrissionPage.common import wait_until |
make_session_ele | 从 html 文本生成ChromiumElement 对象 | from DrissionPage.common import make_session_ele |
configs_to_here | 把配置文件复制到当前路径 | from DrissionPage.common import configs_to_here |
get_blob | 获取指定的 blob 资源 | from DrissionPage.common import get_blob |
ElementNotFoundError | 异常类,全部在路径DrissionPage.errors 里 | from DrissionPage.errors import ElementNotFoundError |
另外 DrissionPage 还有一些衍生对象,例如 Tab
、Element
等对象是由 Page
对象生成的,开发过程中需要类型判断时需要导入这些类型。
from DrissionPage.items import SessionElement
from DrissionPage.items import ChromiumElement
from DrissionPage.items import ShadowRoot
from DrissionPage.items import NoneElement
from DrissionPage.items import ChromiumTab
from DrissionPage.items import WebPageTab
from DrissionPage.items import ChromiumFrame
准备工作
如果只使用收发数据包功能,无需任何准备工作。
如果要控制浏览器,需设置浏览器路径。程序默认设置控制 Chrome,所以下面用 Chrome 演示。如果要使用 Edge 或其它 Chromium 内核浏览器,设置方法是一样的。
- 尝试启动浏览器
默认状态下,程序会自动在系统内查找 Chrome 路径。执行以下代码,浏览器启动并且访问了项目文档,说明可直接使用,跳过后面的步骤即可。
from DrissionPage import ChromiumPage
page = ChromiumPage()
page.get('http://g1879.gitee.io/DrissionPageDocs')
- 设置路径
如果上面的步骤提示出错,说明程序没在系统里找到 Chrome 浏览器。可用以下其中一种方法设置,设置会持久化记录到默认配置文件,之后程序会使用该设置启动。
设置方法有2种:
方法一:新建一个临时 py 文件,并输入以下代码,填入您电脑里的 Chrome 浏览器可执行文件路径,然后运行。
from DrissionPage import ChromiumOptions
path = r'D:\Chrome\Chrome.exe' # 请改为你电脑内Chrome可执行文件路径
ChromiumOptions().set_browser_path(path).save()
这段代码会把浏览器路径记录到配置文件,今后启动浏览器皆以新路径为准。另外,如果是想临时切换浏览器路径以尝试运行和操作是否正常,可以去掉 .save(),以如下方式结合第1️⃣步的代码。
from DrissionPage import ChromiumPage, ChromiumOptions
path = r'D:\Chrome\Chrome.exe' # 请改为你电脑内Chrome可执行文件路径
co = ChromiumOptions().set_browser_path(path)
page = ChromiumPage(co)
page.get('http://g1879.gitee.io/DrissionPageDocs')
方法二:在命令行输入以下命令(路径改成自己电脑里的):
dp -p D:\Chrome\chrome.exe
注意要先使用 cd 命令定位到项目路径
简单的使用示例
DrissionPage 的三个主要的类 ChromiumPage
、SessionPage
和 WebPage
分别用于主要的三种模式:浏览器模式、数据包模式、混合模式。
控制浏览器
DrissionPage 可以类似于 selenium 一样直接控制浏览器。
from DrissionPage import ChromiumPage
# 创建页面对象,并启动或接管浏览器
page = ChromiumPage()
# 跳转到登录页面
page.get('https://gitee.com/login')
# 定位到账号文本框,获取文本框元素
ele = page.ele('#user_login')
# 输入对文本框输入账号
ele.input('您的账号')
# 定位到密码文本框并输入密码
page.ele('#user_password').input('您的密码')
# 点击登录按钮
page.ele('@value=登 录').click()
收发数据包
DrissionPage 可以类似于 requests 一样直接收发数据包获取页面代码,并使用特定的解析语法解析文本获取数据。
from DrissionPage import SessionPage
# 创建页面对象
page = SessionPage()
# 爬取3页
for i in range(1, 4):
# 访问某一页的网页
page.get(f'https://gitee.com/explore/all?page={i}')
# 获取所有开源库<a>元素列表
links = page.eles('.title project-namespace-path')
# 遍历所有<a>元素
for link in links:
# 打印链接信息
print(link.text, link.link)
模式切换
DrissionPage 还能在两种模式间切换执行。切换模式是用来应付登录检查很严格的网站,可以用浏览器处理登录,再转换模式用收发数据包的形式来采集数据。
from DrissionPage import WebPage
# 创建页面对象
page = WebPage()
# 访问网址
page.get('https://gitee.com/explore')
# 查找文本框元素并输入关键词
page('#q').input('DrissionPage')
# 点击搜索按钮
page('t:button@tx():搜索').click()
# 等待页面加载
page.wait.load_start()
# 切换到收发数据包模式
page.change_mode()
# 获取所有行元素
items = page('#hits-list').eles('.item')
# 遍历获取到的元素
for item in items:
# 打印元素文本
print(item('.title').text)
print(item('.desc').text)
print()
浏览器模式
用ChromiumPage()
创建页面对象。根据不同的配置,可以接管已打开的浏览器,也可以启动新的浏览器。程序结束时,被打开的浏览器不会主动关闭,以便下次运行程序时使用(由VSCode启动的会被关闭)。新手在使用无头模式时需注意,程序关闭后其实浏览器进程还在,只是看不见。
ChromiumPage
和WebPage
对象为单例,每个浏览器只能有一个该对象。对同一个浏览器重复使用ChromiumPage
获取的都是同一个对象。
创建浏览器对象
from DrissionPage import ChromiumPage
page = ChromiumPage()
创建ChromiumPage
对象时会在指定端口启动浏览器,或接管该端口已有浏览器。默认情况下,程序使用 9222 端口,浏览器可执行文件路径为’chrome’。如路径中没找到浏览器可执行文件,Windows 系统下程序会在注册表中查找路径。
ChromiumPage
创建时可接收三个参数:
初始化参数 | 类型 | 默认值 | 说明 |
---|---|---|---|
addr_or_opts | str int ChromiumOptions | None | 浏览器启动配置或接管信息。传入 ‘ip: port’ 字符串、端口数字或ChromiumOptions对象时按配置启动或接管浏览器;为None时使用配置文件配置启动浏览器 |
tab_id | str | None | 要控制的标签页 id,为None则控制激活的标签页 |
timeout | float | None | 整体超时时间,为None则从配置文件中读取,默认10 |
如果需要已指定方式启动浏览器,可使用ChromiumOptions
。它是专门用于设置浏览器初始状态的类,内置了常用的配置。
# 导入 ChromiumOptions
from DrissionPage import ChromiumPage, ChromiumOptions
# 创建浏览器配置对象,指定浏览器路径
co = ChromiumOptions().set_browser_path(r'D:\chrome.exe')
# 设置不加载图片、静音、禁用js
co.no_imgs(True).mute(True)no_js(True)
co.incognito() # 匿名模式(无痕模式)
co.headless() # 无头模式
# 另外也支持 Chromium 内核浏览器的一系列启动配置参数
co.set_argument('--no-sandbox') # 无沙盒模式
co.set_argument('--window-size', '800,600') # 设置初始窗口大小
co.set_argument('--start-maximized') # 设置启动时最大化
co.set_argument('--guest') # 使用来宾模式打开浏览器
# 已经配置的参数也可以删除
co.remove_argument('--start-maximized')
co.remove_argument('--window-size')
# 用该配置创建页面对象
page = ChromiumPage(addr_or_opts=co)
访问页面
get()
方法用于跳转到一个网址,
from DrissionPage import ChromiumPage
page = ChromiumPage()
page.get('https://www.baidu.com')
该方法可以接收5个参数,并返回一个 bool 值,表示是否连接成功
参数名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
url | str | 必填 | 目标 url,可指向本地文件路径 |
show_errmsg | bool | False | 连接出错时是否显示和抛出异常 |
retry | int | None | 重试次数,为None时使用页面参数,默认 3 |
interval | float | None | 重试间隔(秒),为None时使用页面参数,默认 2 |
timeout | float | None | 加载超时时间(秒) |
加载模式
加载模式是指程序在页面加载阶段的行为模式,有以下三种:
normal()
:常规模式,会等待页面加载完毕,超时自动重试或停止,默认使用此模式eager()
:加载完 DOM 或超时即停止加载,不加载页面资源none()
:超时也不会自动停止,除非加载完成
前两种模式下,页面加载过程会阻塞程序,直到加载完毕才执行后面的操作。none()
模式下,只在连接阶段阻塞程序,加载阶段可自行根据情况执行stop_loading()
停止加载。这样提供给用户非常大的自由度,可等到关键数据包或元素出现就主动停止页面加载,大幅提升执行效率。
可以在配置对象中进行设置:
from DrissionPage import ChromiumOptions, ChromiumPage
co = ChromiumOptions().set_load_mode('none')
page = ChromiumPage(co)
也可以在运行中设置
from DrissionPage import ChromiumPage
page = ChromiumPage()
page.set.load_mode.eager()
page.get('https://g1879.gitee.io/drissionpagedocs')
none 模式技巧
- 跟监听器配合,可在获取到需要的数据包时,主动停止加载。
from DrissionPage import ChromiumPage
page = ChromiumPage()
page.set.load_mode.none() # 设置加载模式为none
page.listen.start('api/getkeydata') # 指定监听目标并启动监听
page.get('http://www.hao123.com/') # 访问网站
packet = page.listen.wait() # 等待数据包
page.stop_loading() # 主动停止加载
print(packet.response.body) # 打印数据包正文
- 跟元素查找配合,可在获取到某个指定元素时,主动停止加载。
from DrissionPage import ChromiumPage
page = ChromiumPage()
page.set.load_mode.none() # 设置加载模式为none
page.get('http://www.hao123.com/') # 访问网站
ele = page.ele('中国日报') # 查找text包含“中国日报”的元素
page.stop_loading() # 主动停止加载
print(ele.text) # 打印元素text
- 可等待到页面到达某种状态时,主动停止加载。比如多级跳转的登录,可等待 title 变化到最终目标网址时停止。
from DrissionPage import ChromiumPage
page = ChromiumPage()
page.set.load_mode.none() # 设置加载模式为none
page.get('http://www.hao123.com/') # 访问网站
page.wait.title_change('hao123') # 等待title变化出现目标文本
page.stop_loading() # 主动停止加载
获取页面信息
有一些常用的属性和方法能够获取页面的信息
html
此属性返回当前页面html
文本。返回类型:str
json
此属性把请求内容解析成 json,并把这些数据转换为dict格式。需注意如果是API返回的json字符串,请使用SessionPage
对象而不是ChromiumPage
。title
此属性返回当前页面title
文本。返回类型:str
user_agent
此属性返回当前页面user agent
信息。返回类型:str
save(path:Union[str,Path]=None, name:str=None, as_pdf:bool=False,**kwargs)->Union[str, bytes]
当前页面保存为文件,同时返回保存的内容。接收path
、name
和as_pdf
三个参数。如果path
和name
参数都为None,只返回内容,不保存文件。path
为None保存到当前路径,name
为None则使用title
的值。as_pdf
为True
保存为pdf文件,默认False
保存为 mhtml。另外如果as_pdf
为True
返回值为文件字节数据。url
此属性返回当前访问的url
。返回类型:str
tab_id
此属性返回当前标签页的 id。返回类型:str
states.is_loading
此属性返回页面是否正在加载状态。返回类型:bool
states.is_alive
此属性返回页面是否仍然可用,标签页已关闭则返回False
。states.ready_state
此属性返回页面当前加载状态,有 4 种:'connecting'
: 网页连接中,'loading'
:表示文档还在加载中,'interactive'
:DOM 已加载,但资源未加载完成,'complete'
:所有内容已完成加载。states.has_alert
此属性以布尔值返回页面是否存在弹出框。cookies(as_dict:bool=False, all_domains:bool=False, all_info:bool=False)->Union[dict, list]
此方法返回 cookies 信息。接收3个参数,默认均为False
:as_dict
为True
时返回字典类型,为False
返回 cookie 组成的列表;all_domains
是否返回所有cookies
,为False
只返回当前 url 的;all_info
返回的 cookies 是否包含所有信息,False
时只包含name
、value
、domain
信息session_storage(item:str=None)->Union[dict, str]
此方法用于获取 sessionStorage 信息,可获取全部或单个项。该方法接收一个默认为 None 的 str 型参数,是要获取的项目名称,为None则返回全部项目组成的字典。local_storage(item:str=None)->Union[dict, str]
此方法用于获取 localStorage 信息,可获取全部或单个项。参数和使用同session_storage()
。
页面交互
一个 Tab 对象(ChromiumTab
和WebPageTab
)控制一个浏览器的标签页,是页面控制的主要单位。ChromiumPage
和WebPage
也控制一个标签页,只是它们增加了一些浏览器总体控制功能。
get(url:str, show_errmsg:bool=False, retry:int=None, interval:float=None, timeout:float=None)->bool
该方法用于跳转到一个网址。当连接失败时,程序会进行重试。back(steps:int=1)
此方法用于在浏览历史中后退若干步。可以接收1个类型为 int 的参数,默认值为1,为后退步数。forward(steps:int=1)
此方法用于在浏览历史中前进若干步。参数和用法同back()
refresh()
此方法用于刷新当前页面,可以接收一个默认值为False
的 bool 参数,刷新时是否忽略缓存。stop_loading()
此方法用于强制停止当前页面加载。set.blocked_urls(urls:Union[str, list, tuple, None])
此方法用于设置忽略的连接,接收一个必填的参数,类型可以为 str、list、tuple、None,需要忽略的 url,可以使用通配符'*'
,传入 None 时清空已设置项。例如不加载css文件:page.set.blocked_urls('*.css*')
run_js(script, *args, as_expr:bool=False, timetout:float=None)->Any
此方法用于执行 js 脚本。参数script
是js脚本文本或脚本路径;*args
为传入js的参数,按顺序对应为arguments[0]
、arguments[1]
…;as_expr
是否作为表达式运行,为True
时args
参数无效;timetout
是脚本超时时间,为None
则使用页面timeouts.script
设置。返回值为脚本执行结果。run_js_loaded(script, *args, as_expr:bool=False, timetout:float=None)->Any
此方法用于运行 js 脚本,执行前等待页面加载完毕。参数和使用同run_js()
set.cookies(cookies:Union[RequestsCookieJar, list, tuple, str, dict])
此方法用于设置cookie
。可以接收CookieJar
、list
、tuple
、str
、dict
格式的cookies
。set.cookies.clear()
清除所有 cookie。set.cookies.remove(name:str, url:str=None, domain:str=None, path:str=None)
删除一个 cookie。参数分别是cookie的相应字段set.session_storage(item:str, value:Union[str, False])
设置或删除某项 sessionStorage 信息。item
是要设置的项,value
为str
时是设置的值,为False
时表示删除该项。set.local_storage(item:str, value:Union[str, False])
设置或删除某项 localStorage 信息。参数和使用同set.session_storage()
scroll.to_top()
用于滚动页面到顶部,水平位置不变。scroll.to_bottom()
用于滚动页面到底部,水平位置不变。scroll.to_see(loc_or_ele:Union[str, tuple, ChromiumElement], center:Union[bool, None]=None)
滚动页面直到元素可见。参数loc_or_ele
是元素的定位信息,可以是元素、定位符;参数center
是否尽量滚动到页面正中,为None
时如果被遮挡,则滚动到页面正中。set.scroll.wait_complete(on_off:bool=True)
设置滚动后是否等待滚动结束。因为滚动时间不确定,容易导致程序不稳定。此项可以等待滚动结束再继续执行。handle_alert(accept:Union[bool, None]=True, send:str=None, timeout:float=None, next_one:bool=False)->Union[str, False]
处理提示框。能够设置等待时间,等待提示框出现才进行处理,若超时没等到提示框,返回False
。也可只获取提示框文本而不处理提示框。 还可以处理下一个出现的提示框。参数accept
为提示框的处理方式,True
表示确认,False
表示取消,None
不会按按钮但依然返回文本值;send
处理 prompt 提示框时输入文本;timeout
等待提示框出现的超时时间,为None
时使用页面整体超时时间;next_one
是否处理下一个出现的弹窗,为True
时timeout
参数无效。返回值为提示框内容文本或False
未等到提示框。set.auto_handle_alert(on_off:bool=True, accept:bool=True)
设置自动处理提示框,使提示框不会弹窗而直接被处理掉。参数on_off
表示开关设置,accept
表示处理使用确定还是取消。quit(timeout:float=5, force:bool=True)
关闭浏览器,只能使用于Page
对象而不能用于Tag
对象。参数timeout
为等待浏览器关闭超时时间(秒);force
为关闭超时是否强制终止进程。
查找元素
DrissionPage使用了一套简洁的语法用于查找元素,支持内置等待、链式查找,同时也支持 css selector、xpath、selenium 原生的 loc 元组。
ele()
和 eles()
ele()
方法和 eles()
方法类似,区别在于后者返回多个元素列表,前者可以接收一个默认值为 1 的index
参数,表示返回获取的第几个匹配元素(可以为负值表示倒数)。
parent()
、child()
和 children()
这三种方法为查找元素的父子元素,参数中可以接收查询语法。parent()
查询中可以接收数字,表示第几级父元素。child()
接收参数 index
,表示返回第几个匹配到的元素。
next()
、nexts()
和 prev()
、prevs()
这四种方法用于查找当前元素的前 / 后的同级节点。可以使用查询语法,单个查询也支持查找第几个同级节点。
after()
、afters()
和 before()
、befores()
这四种方法用于查找当前元素之前之后的节点,范围不止同级节点,而是整个 DOM 文档。
匹配模式
匹配模式指某个查询中匹配条件的方式,有精确匹配、模糊匹配、匹配开头、匹配结尾四种。大部分查找语法默认使用精确匹配。
- 精确匹配
=
表示精确匹配,匹配完全符合的文本或属性。例如获取name属性为’row1’的元素:ele = page.ele('@name=row1')
- 模糊匹配
:
表示模糊匹配,匹配含有指定字符串的文本或属性。例如获取name属性包含’row1’的元素:ele = page.ele('@name:row1')
- 匹配开头
^
表示匹配开头,匹配开头为指定字符串的文本或属性。例如获取name属性以’row1’开头的元素:ele = page.ele('@name^ro')
- 匹配结尾
$
表示匹配结尾,匹配结尾为指定字符串的文本或属性。例如获取name属性以’w1’结尾的元素:ele = page.ele('@name$w1')
查找语法
DrissionPage 支持css selector、xpath、selenium 原生的 loc 元组,这里只列举单独使用的查找语法。
- id 匹配符
#
表示id属性,只在语句最前面且单独使用时生效,可配合匹配模式使用。例如:在页面中查找id属性为one的元素:ele1 = page.ele('#one')
,在ele1元素内查找id属性包含ne文本的元素:ele2 = ele1.ele('#:ne')
- class 匹配符
.
表示class属性,只在语句最前面且单独使用时生效,可配合匹配模式使用。因为默认精确匹配,所以如果某元素有多个类名,必须写 class 属性的完整值(类名的顺序也不能变);如果需要只匹配多个类名中的一个,可以使用模糊匹配符.:
。例如:查找class属性为p_cls的元素:ele2 = ele1.ele('.p_cls')
;精确查找class属性为p_cls1 p_cls2
的元素:ele2 = ele1.ele('.p_cls1 p_cls2 ')
;模糊查找class属性含有类名 ‘p_cls2’ 的元素:ele2 = ele1.ele('.:p_cls2')
- 单属性匹配符
@
表示匹配某一个属性。例如:查找name属性为row1的元素ele2 = ele1.ele('@name=row1')
;查找有name属性的元素ele2 = ele1.ele('@name')
;查找没有任何属性的元素ele2 = ele1.ele('@')
;查找email属性为abc@def.com
的元素,有多个@也不会重复处理ele2 = ele1.ele('@email=abc@def.com')
;属性中有特殊字符的情形,匹配abc@def
属性等于v的元素ele2 = ele1.ele('css:div[abc\@def="v"]')
- 多属性与匹配符
@@
匹配同时符合多个条件的元素时使用,每个条件前面添加@@
作为开头。例如:查找name属性为row1且class属性包含cls文本的元素ele2 = ele1.ele('@@name=row1@@class:cls')
- 多属性或匹配符
@|
匹配符合多个条件中任一项的元素时使用,每个条件前面添加@|
作为开头。用法与@@
一致,需注意不能同@@
同时出现在语句中。 - 属性否定匹配符
@!
用于否定某个条件,可与@@
或@|
混用,也可单独使用。 - 文本匹配符
text
要匹配的文本,查询字符串如开头没有任何关键字,也表示根据传入的文本作模糊查找。如果元素内有多个直接的文本节点,精确查找时可匹配所有文本节点拼成的字符串,模糊查找时可匹配每个文本节点。例如:查找文本为“第二行”的元素ele2 = ele1.ele('text=第二行')
;查找文本包含“第二”的元素ele2 = ele1.ele('text:第二')
。 - 文本匹配符
text()
作为查找属性时使用的文本关键字,必须与@
或@@
配合使用。 - 类型匹配符
tag
表示元素的标签,只在语句最前面且单独使用时生效,可与@
、@@
或@|
配合使用。tag:
与tag=
效果一致,没有tag^
和tag$
语法。 - css selector 匹配符
css
表示用 css selector 方式查找元素。css:
与css=
效果一致,没有css^
和css$
语法。 - xpath 匹配符
xpath
表示用 xpath 方式查找元素。xpath:
与xpath=
效果一致,没有xpath^
和xpath$
语法。另外,元素对象的ele()
支持完整的 xpath 语法,如能使用 xpath 直接获取元素属性(字符串类型)。 - selenium 的 loc 元组
查找方法能直接接收 selenium 原生定位元组进行查找,便于项目迁移。例如:page.ele((By.XPATH, '//p[@class="p_cls"]'))
处理 frame
虽然 frame 也能够使用 ele()
方法查找到,并且可以穿透 iframe 标签进行操作(页面对象支持跨级查找,元素对象并不支持),但是不建议这样使用。建议使用 Page
对象的 get_frame()
方法来获取和操作 frame元素。
例如:
- 获取页面中第一个iframe元素:
iframe = page.get_frame(1)
- 获取页面id为theFrame的iframe元素对象:
iframe = page.get_frame('#theFrame')
对于 frame 元素,可以看为一个特殊的元素对象,或页面对象来对待。可以同时操作多个 frame,无需切换。
简化写法
为进一步精简代码,定位语法都可以用简化形式来表示,使语句更短,链式操作时更清晰。
原操作 | 简化后 | 说明 |
---|---|---|
page.ele() | page() | 页面对象定位精简 |
page.ele(@id=xxx) | page(#xxx) | id查找精简 |
page.ele(@class=xxx) | page(.xxx) | class查找精简 |
page.ele(text=xxx) | page(tx=xxx) | text查找精简 |
page.ele(@text()=xxx) | page(@tx()=xxx) | text()查找精简 |
page.ele(tag:img) | page(t:img) | tag 查找精简 |
page.ele(xpath://xxxx) | page(x://xxxx) | xpath查找精简 |
page.ele(css:xxx) | page(c:xxxx) | css 查找精简 |
获取元素信息
一些常用的属性和方法能够获取常用的元素数据信息:
tag
此属性返回元素的标签名text
此属性返回元素内所有文本组合成的字符串attrs
此属性以字典形式返回元素所有属性及值attre()
此方法返回元素某个 attribute 属性值link
此方法返回元素的 href 属性或 src 属性page
此属性返回元素所在的页面对象style()
该方法返回元素 css 样式属性值,可获取伪元素的属性。states.is_checked
此属性以布尔值返回表单单选或多选元素是否选中。states.is_selected
此属性以布尔值返回<select>
元素中的项是否选中。states.is_enabled
此属性以布尔值返回元素是否可用。states.is_displayed
此属性以布尔值返回元素是否可见。src()
此方法用于返回元素src
属性所使用的资源。base64 的可转为bytes
返回,其它的以str
返回。无资源的返回None
。
元素交互
click()
用于左键点击元素。click.right()
此方法实现右键单击元素。click.at()
此方法用于带偏移量点击元素,偏移量相对于元素左上角坐标。不传入offset_x和offset_y时点击元素中间点。click.to_upload()
此方法用于点击元素,触发文件选择框并把指定的文件路径添加到网页。参数为文件上传路径click.to_download()
此方法用于点击元素触发下载,并返回下载任务对象。参数为文件保存路径clear()
清空元素文本input()
向元素输入文本或组合键,也可用于输入文件路径到上传控件。可选择输入前是否清空元素。组合键需要导入类from DrissionPage.common import Keys
,例如:ele.input((Keys.CTRL, 'a', Keys.DEL))
drag()
拖拽元素到相对于当前的一个新位置drag_to()
拖拽元素到另一个元素上或一个坐标上hover()
模拟鼠标悬停在元素上,可接受偏移量,偏移量相对于元素左上角坐标run_js()
用于对元素执行 js 代码,代码中用this表示元素自己。类似于页面中的run_js()