xml(可扩展标记语言)也是一种人类可读的标记语言,但是如同 json 文件一样,没有缩进格式(或者压缩)的 xml 文件,读起来那是挺头疼的。
首先来看一下我们这篇文章要达到的目的,如下图所示:
要实现这种效果,我们总结了三种方法。作为演示的例子,我们使用如下文件 email.xml:
<emails> <email> <from>Sagar</from> <to>Milan</to> <time>2022-10-14</time>
<subject>Writing a lot these days</subject></email> <email>
<from>Sagar</from> <to>Arvind</to> <time>2022-10-13</time> <subject>Heyy, send me the Goa pictures ASAP!</subject>
</email> </emails>
方法1:使用 xmllint 格式化打印 xml
xmllint 工具提供了 --format 选项,可以让用户重新格式化 xml 文件。如下语法所示:
xmllint --format XML_FILE
比如,作为演示,我们使用 email.xml:
xmllint --format email.xml
格式化输出,默认缩进两个空格。如果想要修改为更多的空格(比如4个空格),可以使用环境变量 XMLLINT_INDENT。
比如,我们使用 email.xml 作为例子,使其缩进为 4 个空格:
XMLLINT_INDENT=" " xmllint --format email.xml
结合前一个例子,大家可以看到区别吗?
方法2:使用 XMLStarlet 工具包
XMLStarlet 提供了一组命令,分别用于不同的目的。其中涉及到了 xml 命令,可以通过该命令来执行与 xml 文件相关的操作。
但是在使用之前,需要手动安装,如下所示:
sudo snap install xmlstarlet
要格式化输出 xml,需要使用 xml 命令的 format 选项,如下所示:
xml format email.xml
另外,它还提供了一些其他的选项,如下:
- -n 不添加空格,结果类似于文本向左对齐;
- -t 使用 tab 键输出以提高可读性;
- -o 省略 xml 生命,除了在文件的顶部添加 <?xml version=”1.0″?>;
- -s 添加任意数量的空格。
比如,我们使用 fo 添加 6 个空格来格式化输出 xml 文件:
xml fo -s 6 email.xml
方法3:使用 xml_pp 命令
这个方法不是很灵活,因为 xml_pp 是 Perl 的一个模块,名为 XML::Twig。它不会输出内容,但是会直接修改源文件。它在使用之前,同样需要手动安装。如果你使用的是基于 Debian 的系统,可使用如下命令:
sudo apt install xml-twig-tools
比如,我们使用 record 模式来格式化输出 email.xml:
这里,-i 选项用于在原始文件中进行更改,同时用于附加扩展名。-s 选项用于使用样式选项,这里我使用了 record。