Web自动化中常用XPath定位方式

news2024/10/1 5:32:42

       在进行Web自动化测试时,元素定位是一个至关重要的环节。XPath(XML Path Language)是一种用于在XML文档中定位节点的语言。在Web自动化中,XPath广泛应用于定位HTML元素。本文将详细介绍几种常用的XPath定位方式,包括绝对路径、相对路径、轴定位以及如何定位相同元素的最后一个,并解释一些常见的语法差异和其他轴定位方式。

1. 绝对路径定位

       绝对路径是从文档的根节点开始,逐层向下定位目标元素的路径。这种方式需要精确指定每一层的标签名,路径结构类似于文件夹的目录结构。

1.1 例子

假设有以下HTML结构:

<html>
  <body>
    <div id="main">
      <h1>标题</h1>
      <p class="description">描述信息</p>
      <ul>
        <li class="item">项1</li>
        <li class="item">项2</li>
        <li class="item">项3</li>
      </ul>
    </div>
  </body>
</html>

如果你想通过绝对路径定位到<p>元素(描述信息),可以使用以下XPath表达式:

/html/body/div/p

解释:这里的/表示从根节点开始,逐层进入。首先进入html,然后进入body,接着进入div,最后定位到p。这种方式的缺点是如果HTML结构有所变化,比如增加了新的标签,路径就可能失效。

1.2 Python示例代码

from selenium import webdriver

# 创建浏览器实例
driver = webdriver.Chrome()
driver.get('http://example.com')

# 通过绝对路径定位到描述信息
description = driver.find_element_by_xpath('/html/body/div/p')
print(description.text)  # 输出描述信息

2. 相对路径定位

相对路径是从当前节点开始,使用相对路径定位目标元素。这种方式更灵活,常用于定位元素而不需要关注其完整路径。

2.1 例子

继续使用上面的HTML结构,要定位到描述信息,你可以使用以下XPath表达式:

//p[@class='description']

解释:这里的//表示从文档的任何位置开始查找,@class='description'用于指定类名。这种方式的好处是即使HTML结构有所变化,只要<p>标签的class属性不变,XPath仍然有效。

2.2 Python示例代码

from selenium import webdriver

# 创建浏览器实例
driver = webdriver.Chrome()
driver.get('http://example.com')

# 通过相对路径定位到描述信息
description = driver.find_element_by_xpath('//p[@class="description"]')
print(description.text)  # 输出描述信息

3. XPath语法解析

示例 HTML 结构

<html>
  <head>
    <title>Sample Page</title>
  </head>
  <body>
    <div id="main">
      <h1>Main Title</h1>
      <div class="content">
        <p class="text">This is a paragraph in the content.</p>
        <ul>
          <li>List Item 1</li>
          <li>List Item 2</li>
          <li>List Item 3</li>
        </ul>
      </div>
      <div class="footer">
        <p>Footer Text</p>
      </div>
    </div>
    <div class="sidebar">
      <h2>Sidebar Title</h2>
      <p>Sidebar content goes here.</p>
    </div>
  </body>
</html>

3.1 ///的区别

  • /:表示从根节点开始的绝对路径。例如,/html/body意味着你从最上面的html开始查找,然后进入body。这个路径是具体且不容许有任何偏差的。

  • //:表示从任意位置开始的相对路径,能在文档的任何位置查找。它可以选择当前节点及其所有后代节点中的匹配元素,无论它们的层级关系如何。例如,//div会查找文档中所有的div元素。它的灵活性使得在复杂的文档结构中仍然能够找到目标元素。

使用 /
  1. 获取标题

    /html/head/title
    这条 XPath 表达式从根节点 /html 开始,选择 headtitle 元素。它只会返回 <title>Sample Page</title>
  2. 获取主内容中的第一个段落

    /html/body/div[@id='main']/div[@class='content']/p[1]

    这个表达式从根节点开始,依次选择具有特定 ID 和类名的元素,最后选择 content 下的第一个 p 元素,返回 This is a paragraph in the content.

使用 //

        1.获取所有段落

//p

        这条 XPath 表达式会查找文档中的所有 p 元素,包括主内容中的段落和侧边栏中的段落。返回所有匹配的段落元素 ,返回 【This is a paragraph in the content.】和S【idebar content goes here.】

        2.获取所有列表项:

//ul/li

 这个表达式将查找所有 ul 下的 li 元素,不论其层级位置。返回所有列表项。

        3.获取具有特定类名的所有元素

//div[@class='content']//p

        这个表达式从具有类名 contentdiv 开始,查找该div下所有的 p 元素。返回匹配的所有段落。返回 This is a paragraph in the content.

3.2 /..parent::

  • /..:表示父节点。例如,如果你定位到一个元素,使用/..可以直接获取其父节点。它的用法非常直观,像是在文件系统中返回上一级目录。

  • parent:::也是用来定位父节点的轴定位方式,它在XPath中更具表达性,通常用于复杂的XPath表达式。它可以更清晰地表述你是在寻找某个节点的父节点,而不仅仅是通过路径返回。

示例代码

# 通过/..获取父节点
parent_div = driver.find_element_by_xpath('//p[@class="description"]/..')

# 通过parent::获取父节点
parent_div_alt = driver.find_element_by_xpath('//p[@class="description"]/parent::div')

4. 轴定位

XPath的轴定位允许我们从当前节点或特定节点向任意方向查找元素。这使得定位更加灵活。

4.1 常用的轴定位示例

  • ancestor:选取当前节点的所有祖先节点,类似于向上追溯父母辈。
  • following-sibling:选取当前节点后面的所有同级节点,比如在兄弟姐妹中找。
  • preceding-sibling:选取当前节点前面的所有同级节点,仍然是在兄弟姐妹中找,但是方向相反。

4.2 其他轴定位方式

  • child:选取当前节点的所有子节点,像是寻找儿女。
  • descendant:选取当前节点的所有后代节点,类似于寻找孙子、孙女。
  • following:选取当前节点之后的所有节点,像是在时间轴上往后看。
  • preceding:选取当前节点之前的所有节点,像是在时间轴上往前看。
  • self:选取当前节点,这对于某些复杂的表达式很有用。

4.3 示例代码

假设我们要选取描述信息的所有子节点,可以使用:

//div[@id='main']/child::*

要获取描述信息的所有后代节点,可以使用:

//div[@id='main']/descendant::*

4.4 Python示例代码

# 获取所有子节点
children = driver.find_elements_by_xpath('//div[@id="main"]/child::*')
for child in children:
    print(child.tag_name)  # 输出所有子节点的标签名

# 获取所有后代节点
descendants = driver.find_elements_by_xpath('//div[@id="main"]/descendant::*')
for descendant in descendants:
    print(descendant.tag_name)  # 输出所有后代节点的标签名

5. 定位相同元素的最后一个

       在一些情况下,我们需要定位多个相同类型的元素,例如列表项,并提取最后一个元素。可以使用last()函数。

5.1 示例

要定位最后一个列表项,可以使用以下XPath表达式:

//li[@class='item'][last()]

解释last()函数能够帮助你找到同类元素中的最后一个,避免了需要计算列表长度的问题。

5.2 Python示例代码

from selenium import webdriver

# 创建浏览器实例
driver = webdriver.Chrome()
driver.get('http://example.com')

# 通过XPath定位最后一个具有相同类名的li元素
last_item = driver.find_element_by_xpath('//li[@class="item"][last()]')
print(last_item.text)  # 输出最后一个项的文本

6. 总结

       XPath是一种强大的定位工具,绝对路径、相对路径、轴定位及定位最后一个元素的方法都是常用的定位方式。通过理解///的区别、/..parent::的用法,以及其他轴定位方式,可以更有效地进行元素定位。希望本文能帮助你更好地理解和使用XPath进行元素定位,提升Web自动化测试的效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2181595.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

定时器定时中断定时器外部中断

TIM的函数 // 恢复缺省设置 void TIM_DeInit(TIM_TypeDef* TIMx); // 时基单元初始化&#xff0c;第一个参数TIMx选择某个定时器&#xff0c;第二个参数是结构体&#xff0c;包含了配置时基单元的一些参数。 void TIM_TimeBaseInit(TIM_TypeDef* TIMx, TIM_TimeBaseInitTypeDe…

28 Vue3之搭建公司级项目规范

可以看到保存的时候ref这行被提到了最前面的一行 要求内置库放在组件的前面称为auto fix&#xff0c;数组new arry改成了字面量&#xff0c;这就是我们配置的规范 js规范使用的是airbnb规范模块使用的是antfu 组合prettier&eslint airbnb规范&#xff1a; https://github…

《More Effective C++》的学习

引用与指针 没有所谓的null reference reference一定需要代表某个对象&#xff0c;所以C要求reference必须有初值。 QString &s; 使用reference可能比使用pointer更高效。 因为reference一定是有效的&#xff0c;而指针可能为空&#xff08;需要多加一个判断&#xff0…

Springboot3 + MyBatis-Plus + MySql + Vue + ProTable + TS 实现后台管理商品分类(最新教程附源码)

Springboot3 MyBatis-Plus MySql Uniapp 商品加入购物车功能实现&#xff08;针对上一篇sku&#xff09; 1、效果展示2、数据库设计3、后端源码3.1 application.yml 方便 AliOssUtil.java 读取3.2 model 层3.2.1 BaseEntity3.2.1 GoodsType3.2.3 GoodsTypeSonVo3.3 Controll…

论文翻译 | LLaMA-Adapter :具有零初始化注意的语言模型的有效微调

摘要 我们提出了一种轻量级的自适应方法&#xff0c;可以有效地将LLaMA微调为指令遵循模型。lama - adapter采用52K自指导演示&#xff0c;在冻结的LLaMA 7B模型上只引入1.2M可学习参数&#xff0c;在8个A100 gpu上进行微调花费不到一个小时。具体来说&#xff0c;我们采用了一…

Vue3+Antv X6流程图基本使用

安装 antv/X6 npm i antv/x6 <template><div class"homes"><div class"Shang">上</div><div class"Zhong"><div id"container"></div></div><div class"Xia">下<…

wordpress Contact form 7发件人邮箱设置

此教程仅适用于演示站有留言的主题&#xff0c;演示站没有留言的主题&#xff0c;就别往下看了&#xff0c;免费浪费时间。 使用了Contact form 7插件的简站WordPress主题&#xff0c;在有人留言时&#xff0c;就会发邮件到网站的系统邮箱(一般与管理员邮箱为同一个)里。上面显…

Java | Leetcode Java题解之第448题找到所有数组中消失的数字

题目&#xff1a; 题解&#xff1a; class Solution {public List<Integer> findDisappearedNumbers(int[] nums) {int n nums.length;for (int num : nums) {int x (num - 1) % n;nums[x] n;}List<Integer> ret new ArrayList<Integer>();for (int i …

传奇外网架设教程带图文解说—Gee引擎

架设前准备工作&#xff1a; ①通过百度网盘下载版本、补丁、客户端和DBC2000。版本解压到D盘&#xff0c;客户端解压到D盘或是E盘&#xff0c;补丁先不解压 ②安装和配置DBC2000&#xff0c;有些版本不一定用的是DBC2000数据库&#xff0c;看引擎默认的数据库是哪个 DBC数据…

【机器学习基础】Transformer学习

Transformer学习 梯度消失FeedForward层激活函数的主要作用是在网络中加入非线性变换 梯度消失 梯度爆炸 FeedForward层 Transformer结构: Transformer结构主要分为两大部分: 一是Encoder层结构:Encoder 的输入由 Input Embedding 和 Positional Embedding 求和输入Multi…

【SpringBoot详细教程】-08-MybatisPlus详细教程以及SpringBoot整合Mybatis-plus【持续更新】

目录 🌲 MyBatis Plus 简介 🌾入门案例 🌾 MP 简介 🌲 MP 的CRUD 🌾 新增 🌾 删除 🌾 修改在进行 🌾 根据ID查询 🌾 查询所有 🌲 分页功能 🌾 设置分页参数 🌾 设置分页拦截器 🌲 优化启动 🌾 取消mbatisPlusBanner 🌾 取消Sprin…

仿真设计|基于51单片机的路口交通灯控制系统仿真

目录 具体实现功能 设计介绍 51单片机简介 资料内容 仿真实现&#xff08;protues8.7&#xff09; 程序&#xff08;Keil5&#xff09; 全部内容 资料获取 具体实现功能 &#xff08;1&#xff09;东西向右转和直行绿灯20S&#xff0c;左转红灯&#xff1b;南北向直行和…

若依从redis中获取用户列表

因为若依放入用户的时候&#xff0c;会在减值中添加随机串&#xff0c;所以用户的key会在redis中变成&#xff1a; login_tokens:6af07052-b76d-44dd-a296-1335af03b2a6 这样的样子。 如果用 Set<Object> items redisService.redisTemplate.keys("login_tokens&…

wordpress重置密码的方法

通过phpMyAdmin直接修改数据库&#xff1a; 登录到phpMyAdmin(通常在cPanel中找到)&#xff0c;找到WordPress数据库&#xff0c;进入wp_users表。 找到对应的用户ID行&#xff0c;修改user_pass字段为新的密码值&#xff0c;并保存更改。 比如&#xff0c;把值改为&#xff…

Mysql ONLY_FULL_GROUP_BY模式详解、group by非查询字段报错

文章目录 一、问题报错二、ONLY_FULL_GROUP_BY模式2.1、什么是ONLY_FULL_GROUP_BY&#xff1f;2.2、为什么要使用ONLY_FULL_GROUP_BY&#xff1f;2.3、查看sql_mode 三、解决方法3.1、关闭only_full_group_by模式3.1.1、方法一&#xff1a;关闭当前会话中的only_full_group_by3…

电商选品/分析| 亚马逊常见插件爬虫实战之-helium插件

说明 插件爬虫相当于二次爬虫,二次加工信息,因为大部分插件信息也是从正规网上去获取数据,这次列举helium插件爬虫案例,其他插件爬虫也是类似这个方式. 需求 1、⽤⾕歌浏览器&#xff0c;下载chrome extension&#xff1a;“Helium 10 2、登录helium10 3、打开 打开Amazo…

详细阐述matplotlib.pyplot中plot模块的相关用法和参数以及一些画图基础用法(解决图例不完全显示、中文不显示问题等。)

本文章类似于一篇学习笔记&#xff0c;matplotlib.pyplot是一个很实用的图像绘图模块&#xff0c;下面主要针对plot()绘图函数进行系统性的阐述。 目录 关于figure() figure() 的基本使用 plt.figure() 常用参数 figsize 和 dpi facecolor 和 edgecolor 图形的编号和重…

PHP反序列化8(phar反序列化)

考点8&#xff1a;phar反序列化 <aside> &#x1f4a1; 使用条件 </aside> 文件上传时&#xff0c;不必要.phar后缀&#xff0c;文件上传不是难点&#xff01;&#xff01;&#xff01;&#xff08;phar伪协议自动解析成.phar文件&#xff09; phar文件本质上是…

【网络安全】内部应用中的多重漏洞利用

未经许可,不得转载。 文章目录 初步发现:帐户枚举利用帐户枚举发现 IDOR 导致帐户接管拦截请求洪水攻击:注册拒绝服务目标网站:https://redacted.com 初步发现:帐户枚举 在最近的一次渗透测试中,我对一个仅供员工使用的内部应用程序进行了评估,重点关注身份验证和帐户…

LangChain进阶技巧:提高聊天机器人性能的策略[第三课]

LangChain应运而生&#xff0c;为开发者们提供了一种高效、便捷的工具&#xff0c;助力他们构建出功能强大的大型语言模型应用。本文将带您走进LangChain的世界&#xff0c;揭秘其背后的技术原理&#xff0c;探讨如何利用这一利器来拓展语言模型的无限可能。通过丰富的实例分析…