Linux命令:用于处理 XML 文档的强大的命令行工具xmlstarlet 详解

news2024/9/27 21:42:53

目录

一、概述

二、功能特点

1、查询和过滤

2、修改和更新

3、批处理操作

4、跨平台支持

5、转换和格式化

6、验证和校验

三、 安装 xmlstarlet

四、 基本用法

1、xmlstarlet 的基本语法

2、获取帮助

五、 常用命令

1. ed(编辑) - 用于编辑 XML 文档

2. sel(选择) - 用于查询 XML 文档

3. fo(格式化) - 用于格式化 XML 文件,使其更易于阅读

4. tr(转换) - 用于将 XML 转换为其他格式

5. val(验证) - 用于验证 XML 文档是否符合指定的 DTD 或 XML Schema

6. elt(创建元素) - 用于创建新的 XML 元素

六、 使用 XPath 表达式

七、完整的例子

八、总结


一、概述

        xmlstarlet 是一个强大的命令行工具,用于处理 XML 文档。它可以用来执行各种操作,如格式化、查询、修改、验证和转换 XML 数据。xmlstarlet 支持 XPath 和 XQuery 表达式,这使得在命令行中处理 XML 文档变得非常方便。

二、功能特点

1、查询和过滤

(XmlStarlet支持使用XPath表达式对XML文档进行查询和过滤,以获取所需的数据。XPath是一种在XML文档中查找信息的语言,它可以根据节点的路径、属性和内容进行选择。例如,查询某个节点值或节点属性值,可以使用xmlstarlet sel命令结合XPath表达式。

2、修改和更新

(1)XmlStarlet可以修改XML文档中的元素和属性,包括更新现有的元素值、添加新的元素和属性、删除不需要的元素和属性,以及重命名元素和属性。

(2)修改操作通常使用xmlstarlet ed命令进行,结合XPath表达式指定要修改的节点。

3、批处理操作

XmlStarlet支持通过批处理文件来执行一系列的XML操作,这有助于自动化处理大量的XML文件,提高工作效率。

4、跨平台支持

XmlStarlet可以在多个操作系统上运行,包括Linux、Windows和Mac OS,这使其成为了一个通用的XML处理工具。

5、转换和格式化

XmlStarlet不仅可以将XML文档转换为其他格式(如HTML、CSV或JSON),还可以格式化XML文档,使其更易于阅读和理解。

6、验证和校验

XmlStarlet可以验证XML文档的结构和语法是否符合特定的规范,如DTD(文档类型定义)或XSD(XML模式定义)。

三、 安装 xmlstarlet

在大多数 Linux 发行版中,可以使用包管理器来安装 xmlstarlet。例如,在基于 Debian 的系统(如 Ubuntu)上,可以使用以下命令:

sudo apt-get install xmlstarlet

实际操作如下:

root@quinn-ThinkPad-T430s:/#
root@quinn-ThinkPad-T430s:/# sudo apt-get install xmlstarlet
正在读取软件包列表... 完成
正在分析软件包的依赖关系树... 完成
正在读取状态信息... 完成
下列【新】软件包将被安装:
  xmlstarlet
升级了 0 个软件包,新安装了 1 个软件包,要卸载 0 个软件包,有 208 个软件包未被升级。
需要下载 265 kB 的归档。
解压缩后会消耗 631 kB 的额外空间。
获取:1 http://mirrors.tuna.tsinghua.edu.cn/ubuntu jammy/universe amd64 xmlstarlet amd64 1.6.1-2.1 [265 kB]
已下载 265 kB,耗时 16秒 (17.0 kB/s)
正在选中未选择的软件包 xmlstarlet。
(正在读取数据库 ... 系统当前共安装有 215859 个文件和目录。)
准备解压 .../xmlstarlet_1.6.1-2.1_amd64.deb  ...
正在解压 xmlstarlet (1.6.1-2.1) ...
正在设置 xmlstarlet (1.6.1-2.1) ...
正在处理用于 man-db (2.10.2-1) 的触发器 ...
root@quinn-ThinkPad-T430s:/#

在基于 Red Hat 的系统(如 CentOS)上,则可以使用:

sudo yum install xmlstarlet

四、 基本用法

1、xmlstarlet 的基本语法

xmlstarlet [命令] [选项] [输入文件]

如果没有提供输入文件,xmlstarlet 将从标准输入读取 XML 数据。

2、获取帮助

在命令行模式下输入如下命令:

xmlstarlet --help

操作结果如下图:

获取到的命令的帮助

五、 常用命令

如下是 xmlstarlet 支持的一些常用命令:

1. ed(编辑) - 用于编辑 XML 文档

   - 例如,替换 XML 中的内容:    

     xmlstarlet ed -u '/path/to/node' -v 'new_value' input.xml > output.xml

    

2. sel(选择) - 用于查询 XML 文档

   - 例如,选择特定的 XML 节点:    

     xmlstarlet sel -t -v '/path/to/node' input.xml

    

3. fo(格式化) - 用于格式化 XML 文件,使其更易于阅读

   - 例如,格式化 XML 文件:    

     xmlstarlet fo input.xml > output.xml

    

4. tr(转换) - 用于将 XML 转换为其他格式

将 XML 转换为其他格式,如 HTML 或文本。

   - 例如,将 XML 转换为 HTML:    

     xmlstarlet tr transform.xsl input.xml > output.html

    

5. val(验证) - 用于验证 XML 文档是否符合指定的 DTD 或 XML Schema

   - 例如,验证 XML 文件:    

     xmlstarlet val -e input.xml

    

6. elt(创建元素) - 用于创建新的 XML 元素

   - 例如,创建一个新的 XML 元素:    

     xmlstarlet elt --root root --child mychild --attribute name="value"

    

六、 使用 XPath 表达式

xmlstarlet 的许多命令都使用 XPath 表达式来定位 XML 文档中的节点。XPath 是一种在 XML 文档中查找信息的语言。

例如,要从 XML 文件中选择所有 title 元素:

xmlstarlet sel -t -m '/bookstore/book/title' -v . -n input.xml

这里的 -m 选项用于匹配节点,-v 用于打印匹配节点的值,-n 用于在每次匹配后添加一个新行。

七、完整的例子

假设有一个名为 books.xml 的 XML 文件,内容如下:

<bookstore>
  <book>
    <title lang="en">Harry Potter</title>
    <author>J.K. Rowling</author>
    <year>2005</year>
  </book>
  <book>
    <title lang="en">Learning XML</title>
    <author>Erik T. Ray</author>
    <year>2003</year>
  </book>
</bookstore>

若要选择所有书籍的标题,可以使用:

xmlstarlet sel -t -m '/bookstore/book/title' -v . -n books.xml

这将输出:

Harry Potter

Learning XML

实际操作如下:

完整的实例操作

八、总结

        XmlStarlet是一个功能强大的XML处理工具,它通过命令行界面提供了丰富的操作命令,使得用户可以轻松地进行XML文档的查询、修改、验证、转换等操作。无论是在自动化脚本中处理XML数据,还是在日常工作中处理XML文件,XmlStarlet都是一个不可或缺的工具。


文章的正下方可以看到我的联系方式:鼠标“点击” 下面的 “威迪斯特-就是video system 微信名片”字样,就会出现我的二维码,欢迎沟通探讨。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2171152.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大型模型智能体:最先进的合作范式、安全与隐私以及未来趋势

摘要—大型模型智能体&#xff08;LM agents&#xff09;&#xff0c;由如 GPT-4 和 DALL-E 2 等大型基础模型驱动&#xff0c;代表了实现人工通用智能&#xff08;AGI&#xff09;的重要一步。LM 智能体展示了自主性、具身性和连接性等关键特征&#xff0c;使其能够在物理、虚…

java在开发中的总结

1.异步执行数据遍历 public static void main(String[] args) {List<Integer> numbers Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);numbers.parallelStream().forEach(i->{System.out.println(i);});}在工作中&#xff0c;我们可以对for循环进行改进&#xff0c;…

C++11:现代C++的演变与提升

目录 前言 一、统一的列表初始化 1、{}初始化 2、std::initializer_list 二、新的声明 1、auto 2、decltype 3、nullptr 三、范围for循环 四、右值引用与移动语义 1. 左值 vs 右值 2、移动构造与移动赋值 3、 move转换 4、完美转发&#xff1a;forward 五、lamb…

调和级数枚举+前缀和,CF 731F - Video Cards

目录 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 二、解题报告 1、思路分析 2、复杂度 3、代码详解 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 731F - Video Cards 二、解题报告 1、思路分析 题目提示的很明显要用调和…

复杂类型 el-form 表单的校验

背景描述 表单结构 form 表单结构 活动名称 - 必填&#xff0c;prop“name”活动类型 - 必填&#xff0c;prop“actType”活动人数 - 必填&#xff0c;prop“actUserAccount”签到记录 - 必填&#xff0c;prop“actList” 对表单做必填校验 rulesOld: {name: [{ required: t…

【15%】100小时机器学习——什么是机器学习

前言 虽然已经好久没有更新了&#xff0c;但笔者最近一直都在努力学习哦。 前面三三两两根据GitHub上的项目写了一些实验操作&#xff0c;但是总觉得这样是不行的。碎片化的学习只能是建立在已知的基础上进行熟练&#xff0c;不能作为打基础的主力方法&#xff0c;最关键的是&a…

物联网系统中声音拾取音频方案_咪头

01 物联网系统中为什么要使用咪头 物联网系统中使用咪头&#xff08;麦克风或传声器&#xff09;的原因主要可以归结为以下几个方面&#xff1a; 声音信号的拾取与转换 基本功能&#xff1a;咪头是一种将声音转换为电信号的装置。在物联网系统中&#xff0c;咪头负责捕捉周围…

一键降重:芝士AI如何简化论文查重过程?

大家写论文时“旁征博引”是常规操作&#xff0c;所以重复率就成了投稿前的“噩梦”。自己降重&#xff0c;发现怎么改写都无法下降重复率&#xff0c;可能一天改下来下降3%&#xff0c;让人抓狂。 但今天开始&#xff0c;你不用再苦恼啦&#xff0c;更不用自己抓耳挠腮一整天…

商汤SenseNova 5.5大模型的应用实践

SenseNova 5.5如何重塑金融、医疗与自动驾驶的未来 ©作者|wy 来源|神州问学 一、引言 人工智能&#xff08;AI&#xff09;作为引领未来发展的重要力量&#xff0c;正以前所未有的速度改变着我们的生活和工作方式。每年一度的世界人工智能大会&#xff08;WAIC&#xf…

高密度EEG人脑成像:技术与应用

摘要 EEG是一种非侵入性的人脑神经活动测量技术。随着数字技术的进步&#xff0c;EEG分析已从定性分析幅值和频率调制发展到全面分析记录信号的复杂时空特征。EEG能够在亚秒级的时间范围内测量神经过程&#xff0c;但其空间分辨率较低&#xff0c;这使得难以准确可靠地定位EEG…

【Gitee自动化测试5】Gitee免费版的所有按钮

一、首页 就红框里有用 1. 仓库&#xff08;Repository&#xff09; 功能&#xff1a;仓库是一个项目的存储空间&#xff0c;用于保存源代码、文档、配置文件等与项目相关的内容。每个仓库通常会有一个版本控制系统&#xff08;如 Git&#xff09;来跟踪代码的变更历史。用…

Xinstall助力广告主实现精准投放,提升App广告效果!

随着移动互联网的快速发展&#xff0c;App广告投放已成为品牌推广的重要手段。然而&#xff0c;广告投放的效果如何&#xff0c;是否达到了预期的目标&#xff0c;这些问题一直困扰着广告主。今天&#xff0c;我们就来聊聊App广告投放数据统计的痛点&#xff0c;以及Xinstall如…

从体质入手:气虚痰湿人群的健康攻略

“气虚”与“痰湿”是中医体质学九大体质中常见的两种易胖体质&#xff0c;可以说大多数肥胖人群都有这两种体质的身影。比如气虚质的特征是容易疲劳&#xff0c;乏力&#xff0c;出汗&#xff0c;抵抗力差&#xff0c;声弱&#xff0c;气短&#xff0c;面部苍白或萎黄等&#…

车辆目标检测、工程车辆检测算法、工程车辆类型检测

工程车辆检测算法主要用于智能交通系统、建筑工地管理、矿山开采、物流运输等领域&#xff0c;通过图像识别技术来检测和识别视频或图像中的工程车辆。这种技术可以帮助管理者实时监控工程车辆的活动&#xff0c;确保施工安全、交通流量管理和资源调度的效率。以下是关于工程车…

cups-browsed远程代码执行漏洞安全风险通告

今日&#xff0c;亚信安全CERT监控到安全社区研究人员发布安全通告&#xff0c;披露了cups-browsed 远程代码执行漏洞(CVE-2024-47176)。由于cups-browsed 服务在处理网络打印任务时&#xff0c;会绑定到 UDP 端口 631 上的 INADDR_ANY 地址&#xff0c;从而信任来自任何来源的…

uniapp框架中实现文件选择上传组件,可以选择图片、视频等任意文件并上传到当前绑定的服务空间

前言 uni-file-picker是uniapp中的一个文件选择器组件,用于选择本地文件并返回选择的文件路径或文件信息。该组件支持选择单个文件或多个文件,可以设置文件的类型、大小限制,并且可以进行文件预览。 提示:以下是本篇文章正文内容,下面案例可供参考 uni-file-picker组件具…

Linux高级IO之poll与epoll

文章目录 poll使用 epoll系统调用 epoll的工作原理红黑树队列 epoll的工作模式水平触发边缘触发 Reactor设计模式工作原理epoll Reactor设计模式的简单示例 poll和epoll都是多路转接的调用&#xff0c;但是epoll实在过于优秀了&#xff0c;一般也都是用epoll的&#xff0c;除此…

mysql索引结构操作(主键/唯一键/普通索引的创建/查询/删除),复合索引介绍(索引覆盖,索引最左匹配原则)

目录 索引操作 创建索引 主键索引 介绍 在创建表时设置主键 创建表后添加主键 唯一键索引 介绍 在创建表时设置唯一键 创建表后添加唯一键 普通索引 在创建表时指定某列为索引 创建表后添加普通索引 自主命名索引 索引创建原则 哪些列适合创建索引 不适合作为…

猫头虎带你解决:error Error: certificate has expired

&#x1f42f;猫头虎带你解决&#xff1a;error Error: certificate has expired &#x1f4a5; 今天有粉丝问猫哥&#xff1a;“&#x1f42f;猫头虎&#xff0c;我在 Node.js 项目中使用 Yarn 安装包时遇到了一个错误&#xff1a;Error: certificate has expired。你能帮忙解…

【机器学习(十二)】机器学习回归案例之二手汽车价格预测—XGBoost回归算法—Sentosa_DSML社区版

文章目录 一、算法和背景介绍二、Python代码和Sentosa_DSML社区版算法实现对比(一) 数据读入与统计分析(二) 数据处理(三) 特征选择与相关性分析(四) 样本分区与模型训练(五) 模型评估和模型可视化 三、总结 一、算法和背景介绍 关于XGBoost的算法原理&#xff0c;已经进行了介…