6.xpath的基本使用

news2026/3/28 23:49:41

xpath是python做数据解析的库

目录

1 安装

2 解析本地的html文件

2.1 只有一个标签的情况

2.2 有多个标签的情况

3 解析网上的页面

4 xpath表达式

4.1 绝对路径

4.2 两个斜杠表示中间隔了0级或多级

4.3 通过属性查找

4.4 通过索引查找

4.5 获取文本内容

4.6 获取属性

4.7 或运算

5 xpath返回的对象使用xpath

6 常见错误

6.1 存在没闭合的标签

1 安装

pip install lxml

2 解析本地的html文件

2.1 只有一个标签的情况

比如我想找到test.html中的title

xpath()中接的是xpath表达式，xpath就和linux中的路径一样，先是html然后是head最后找到title

由于title只有一个，所以返回的结果列表中只有一个title对象

2.2 有多个标签的情况

比如我现在想找到这两个div

3 解析网上的页面

4 xpath表达式

4.1 绝对路径

4.2 两个斜杠表示中间隔了0级或多级

可以表示0级

也可以表示多级

由于两个斜杠表示多级，所以一开始的html也没必要写了

4.3 通过属性查找

比如我找这个

再比如我找这个

4.4 通过索引查找

上面我是对tree.xpath()返回的列表进行索引，我们也可以直接写在xpath表达式中，比如我找第二个div

xpath表达式是从第1个算的，不算从第0个算的

4.5 获取文本内容

上面我是在外部使用的text，你也可以在里面使用text()，比如我想获得所有div的文本内容

text()只能拿到直系的文本内容，隔一层就拿不到了

如果你写 //text() 就可以拿到了

4.6 获取属性

比如我想取所有div的something属性值

只有一个div有something这个属性，所以只显示一个

换一个属性也一样，比如class

4.7 或运算

比如我现在想那 span或div 的内容

5 xpath返回的对象使用xpath

6 常见错误

6.1 存在没闭合的标签

我现在想找这个title

那我可以这样写

运行后会报错

这个错误的原因就是有没闭合的标签，比如这里的meta

我们需要闭合这里的标签

|然后再运行就可以了

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/975850.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

JavaScript-----运算符与流程控制

JavaScript-----运算符与流程控制

目录前言： 1. 运算符 1.1 算术运算符 1.2 赋值运算符 1.3 比较运算符 1.4 逻辑运算符 2.流程控制 1.1 分支结构 switch语句 1.2 循环结构 while 循环 for循环循环控制 : 1.3代码示例前言： 今天我们就开始学习JavaScript里面的运算符和流…

阅读更多...

【校招VIP】测试开发之字符串算法

【校招VIP】测试开发之字符串算法

考点介绍： 字符串匹配看起来是个很简单、很成熟的问题，但在很多领域都有着很多的应用，比如模式匹配、特征提取等等。字符串算法是很经典的面试题，既考察了求职者的写用例水平又考察了软件测试求职者的编码水平。测试开发之字符串…

阅读更多...

景联文数据标注：AI大模型在教育和医疗领域的应用

景联文数据标注：AI大模型在教育和医疗领域的应用

8月31日消息，备受行业瞩目的首批大模型产品获批名单发布，首批通过备案的8家大模型公司分别是：百度（文心一言）、抖音（云雀大模型）、智谱AI（GLM大模型）、中科院&#xff08…

阅读更多...

centos7上hive3.1.3安装及配置

centos7上hive3.1.3安装及配置

1、安装背景； hive是基于hadoop的数据仓库软件，部署运行在linux系统之上，安装之前必须保证hadoop环境运行正常，hive本身不是分布式软件，它的分布式主要是借助hadoop实现，存储是hdfs，计算是mapr…

阅读更多...

彻底学会Unity从网上加载资源到场景

彻底学会Unity从网上加载资源到场景

使用类WWW 该类实例化的对象可以存储多种多媒体资源，只需要在构造函数中附上可访问的资源链接 Unity 中，WWW 类用于实例化互联网上的资源，如文本、图像、音频和视频等。WWW 实例化的对象可以存储多种多媒体素材。以下是一些常见的例子&…

阅读更多...

Kubernetes(k8s) 架构原理一文详解

Kubernetes(k8s) 架构原理一文详解

目录一、k8s 概述 1.什么是k8s？ 2.特性 3.主要功能三、集群架构与组件 1.Master 组件 （1）Kube-apiserver （2）Kube-controller-manager （3）Kube-scheduler 2.配置存储中心 3.Node 组…

阅读更多...

Cell Reports | 揭开METTL14在介导m6A修饰中的神秘面纱

Cell Reports | 揭开METTL14在介导m6A修饰中的神秘面纱

m6A被认为是最丰富的mRNA修饰，广泛分布在大多数真核生物中，包括哺乳动物、植物、昆虫、酵母和某些病毒。m6A修饰的沉积和去除之间的动态平衡对于正常的生物过程和发育至关重要，如失调通常与癌症等疾病有关。m6A修饰由m6A甲基转移酶复合物&…

阅读更多...

C++多态案例3----组装电脑含测试代码

C++多态案例3----组装电脑含测试代码

案例描述: 电脑主要组成部件为 CPU (用于计算) ，显卡 (用于显示) ，内存条 (用于存储)将每个零件封装出抽象基类，并且提供不同的厂商生产不同的零件，例如Intel厂商和Lenovo厂商创建电脑类提供让电脑工作的函数，并且调用…

阅读更多...

nc前端合计行、按钮组

nc前端合计行、按钮组

nc前端合计行、按钮组 1.无表体和单表体的合计行加法只要卡片下如果是只有表头要合计行就只留ShowTotalLine；如果是只有表体要合计行就只留ShowTotalLineTabcodes 2.多表体的合计行加法表头卡片下和列表下都要 3.档案的合计行加法重写一下列表模板 …

阅读更多...

9.4作业

9.4作业

服务器 #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);servernew QTcpServer(this); }Widget::~Widget() {delete ui; }void Widget::on_pushButton_clicked(…

阅读更多...

PhpStorm软件安装包分享（附安装教程）

PhpStorm软件安装包分享（附安装教程）

目录一、软件简介二、软件下载一、软件简介 PhpStorm是一款由JetBrains开发的专业PHP集成开发环境（IDE），旨在提供全面的PHP开发支持。它是基于IntelliJ IDEA平台构建的，具有强大的功能和工具，可以帮助开发人员提高…

阅读更多...

VIOOVI解析：如何进行工时测定？什么工时测定软件比较准确？

VIOOVI解析：如何进行工时测定？什么工时测定软件比较准确？

通常来说，在正常的操作条件下，普通且熟练的工人用正常的作业速度完成工作所需要的时间，我们将之称为标准工时。标准工时的准确性对整个企业的生产经营起着至关重要的作用。错误的工时测定，提供的数据往往会引发企业高层决策上的…

阅读更多...

【Java】Java虚拟线程开启preview

【Java】Java虚拟线程开启preview

JEP 425:虚拟线程(预览版)最近被提出。这是java中一个期待已久的特性。我想试一试。所以我下载了JDK的早期版本，其中包含了这个项目。然而，它还在预览阶段。 SDK19、IntelliJ IDEA Community Edition 2023.1.4 代码： package com.example.…

阅读更多...

计算机竞赛基于深度学习的人脸表情识别

计算机竞赛基于深度学习的人脸表情识别

文章目录 0 前言1 技术介绍1.1 技术概括1.2 目前表情识别实现技术 2 实现效果3 深度学习表情识别实现过程3.1 网络架构3.2 数据3.3 实现流程3.4 部分实现代码 4 最后 0 前言 🔥 优质竞赛项目系列，今天要分享的是基于深度学习的人脸表情识别该项目较…

阅读更多...

唯品会API接口解析，实现获得按关键字搜索vip商品

唯品会API接口解析，实现获得按关键字搜索vip商品

要解析唯品会API接口并实现按关键字搜索VIP商品，你需要进行以下步骤： 了解唯品会API接口文档：访问唯品会开放平台，找到API文档，了解唯品会提供的API接口以及相关的参数、返回值等信息。注册开发者账号：在唯…

阅读更多...

【Unity-Cinemachine相机】虚拟相机旋转Composer属性详解

【Unity-Cinemachine相机】虚拟相机旋转Composer属性详解

Look At和Aim本质是控制虚拟相机自身的旋转，并不一定非要看着，或者并不一定非要瞄着这里的游戏对象 Look At和Aim是以Look At里面的对象作为参考来旋转自身 Do nothing：表现出来的行为和Look At空出来一样 Composer：是一个标准的…

阅读更多...

如何搭建“实战化”的统一系统脆弱性管理平台

如何搭建“实战化”的统一系统脆弱性管理平台

面对层出不穷的漏洞，如何搭建“实战化”的统一系统脆弱管理平台，是网络安全厂商和客户比较头痛的事情。日前，国内专注于保密与非密领域的分级保护、等级保护、业务连续性安全和大数据安全产品解决方案与相关技术研究开发的领军企业——国联易…

阅读更多...

微信小程序商城的定义、特点、优势、未来发展方向

微信小程序商城的定义、特点、优势、未来发展方向

微信小程序商城是一种新兴的电子商务模式，近年来风头火势，深受商家和消费者的喜爱。它是基于微信平台开发的一种小程序，用户可以通过微信进行搜索、购买商品或服务，实现线上购物的便利。本文将从微信小程序商城的定义、特点、优势…

阅读更多...

5分钟带你了解什么是敏捷测试？难点显而易见！

5分钟带你了解什么是敏捷测试？难点显而易见！

随着敏捷开发模式的普及，越来越多的测试同仁也开始了敏捷测试。那么究竟什么是敏捷测试？敏捷测试与传统测试的主要区别是什么？敏捷测试的难点又是什么？本文会对这三个问题进行讲解。注意：本文只是讲解敏捷测试概念相关…

阅读更多...

手写Mybatis：第20章-Mybatis 框架源码10种设计模式分析

手写Mybatis：第20章-Mybatis 框架源码10种设计模式分析

文章目录一、类型：创建型模式1.1 工厂模式1.2 单例模式1.3 建造者模式二、类型：结构型模式2.1 适配器模式2.2 代理模式2.3 组合模式2.4 装饰器模式三、类型：行为型模式3.1 模板模式3.2 策略模式3.3 迭代器模式一、类型：创建型…

阅读更多...

推荐文章

最新文章