XML文档详解

news2025/1/11 2:26:58

目录

XML文档

一、XML文件

二、Dom4J解析XML文件

三、Sax解析XML文件

四、使用Dom4j的XPath解析XML文件

4.1XPath语法

4.2 获取sys-config.xml文件的配置信息

4.3 获取server.xml文件的配置信息

4.4 获取bookstore.xml文件的配置信息


XML文档

一、XML文件

1.1 学习重点

由于在现代开发过程中,不需要开发人员手动解析XML文档,因此本次课程主要内容了解XML文档基本学习,以及XML约束文档内容。

1.2 XML编程语言

  • 名称:可扩展标记编程语言,就是开发者在符合XML命名规则的基础之上,可以根据自己的需求定义自己的标签。

  • XML文档作用:

    • 主要用来存储数据

    • 最初XML文档作为网页来使用(现在是HTML)

    • 在Java使用XML文档来代替properties作为配置文件

  • 解析XML文件的方法:DOM、DOM4J、SAX

1.3 XML语法

  • HTML是从XML演化出来的一种编程语言,XML与HTML是父子关系。

  • HTML绝大多数语法都来自XML。

  • 一个XML文档必须以一个根目录标签开始,其它标签必须作为根目录标签的直接子标签或者间接子标签出现。

  • HTML标签对于英文字母大小是忽略不计,但是XML标签必须区分英文字母大小写。

  • HTML标签中属性内容可以通过一对" "包含,也可以不用。XML标签属性内容必须包含在一对" "或者' '。

1.4 XML文档读取方式

  • SAX读取方式:根据开发人员需要,一次将若干个满足条件标签加载到内存中。

    • 优点:可以节省内存。

    • 缺点:如果读取大量标签信息时,运行效率相对较低。

  • DOM读取方式:一次性将XML文档所有的内容加载到内存中。

    • 优点:如果读取大量标签信息时,此时由于是在内存中进行定位,所有运行速度较快。

    • 缺点:浪费内存。

  • 实际开发过程中,一般都采用DOM方式来读取。

二、Dom4J解析XML文件

2.1导入Dom4J.jar包

2.2 Dom4J常用的对象

  • SAXReader:读取XML文件到Document树结构文件对象。

  • Document:是一个XML文档对象树,类比HTML文档对象。

  • Element:元素节点。通过Document对象可以查找单个元素。

2.3 Dom4J解析步骤

package com.hhb.xml;
​
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
​
import java.util.Iterator;
​
public class Dom4jTest {
    public static void main(String[] args) throws Exception {
​
        //创建解析器
        SAXReader reader = new SAXReader();
        //通过解析器的read方法将配置文件读取到内存当中,生成一个Document对象树
        Document document = null;
        document = reader.read("C:\\Users\\Administrator\\IdeaProjects\\xml1\\conf\\students.xml");
        //获取根节点
        Element root = document.getRootElement();
        //开始遍历根节点
        //遍历 root 根节点下的 student 子节点
        for (Iterator iter = root.elementIterator(); iter.hasNext(); ) {
            //获取 student 节点对象
            Element stuElement = (Element) iter.next();
            //遍历 stuElement 节点下的所有子节点:name,colleage,telephone,note
            for (Iterator innerIter = stuElement.elementIterator(); innerIter.hasNext(); ) {
                //获取 student 节点下的子节点对象
                Element innerElement = (Element) innerIter.next();
                //通过 innerElement 的 getName()获取节点名称,getStringValue()获取节点值
                String innerValue = innerElement.getStringValue();
                System.out.println(innerValue);
            }
            System.out.println("--------------------------------");
        }
    }
}
 

三、Sax解析XML文件

3.1 SAX方式:事件驱动,边读边写

  • 优点:无需将整个文档加载到内存中,所有内存消耗较少,适合解析特别大的XML文件。

SAX解析步骤

package com.hhb.xml;
​
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
​
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.IOException;
​
public class SAXTest {
    public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
        //创建解析工厂:通过newInstance()方法获取
        SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();
        //创建解析器
        SAXParser saxParser = saxParserFactory.newSAXParser();
        //执行parser方法,传入两个参数:XML文件路径、事件处理器
        saxParser.parse("C:\\Users\\Administrator\\IdeaProjects\\xml1\\conf\\persons.xml", new MyDefaultHander1());
    }
}
//创建一个类,继承DefaultHandler类,重写三个方法
//startElement 获取开始标签,重要的两个参数说明
//qName 把标签名称返回
//attributes 返回标签中的属性对象
//character 获取标签文本内容
//endElement 获取结束标签
class MyDefaultHander1 extends DefaultHandler {
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        System.out.print("<" + qName + ">");
    }
​
    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        System.out.print(new String(ch, start, length));
    }
​
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        System.out.print("</" + qName + ">");
    }
}

 

 

四、使用Dom4j的XPath解析XML文件

4.1XPath语法

  • XPath使用路径表达式来选取XML文档中的节点或节点集。节点是通过沿着路径(path)或者(steps)来的。

  • XML实例文档

    <?xml version="1.0" encoding="ISO-8859-1"?>
    ​
    <bookstore>
    ​
    <book>
      <title lang="eng">Harry Potter</title>
      <price>29.99</price>
    </book>
    ​
    <book>
      <title lang="eng">Learning XML</title>
      <price>39.95</price>
    </book>
    ​
    </bookstore>
  • 路径表达式

    表达式描述
    nodename选取此节点的所有子节点
    /从根节点选取
    //从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置
    .选取当前节点
    ..选取当前节点的父节点
    @选取属性
  • 实例

    路径表达式结果
    bookstore选取bookstore元素的所有子节点
    /bookstore选取根元素bookstore(假如路径起始于正斜杠/,则此路径始终代表到某元素的绝对路径)
    bookstore/book选取属于bookstore的子元素的所有book元素
    //book选取所有book子元素,而不管它们在文档中的位置
    bookstore//book选取属于bookstore元素的后代的所有book元素,而不管它们位于bookstore之下的什么位置
    //@lang选取名为lang的所有属性
    路径表达式结果
    /bookstore/book[1]选取属于bookstore子元素的第一个book元素
    /bookstore/book[last()]选取属于 bookstore 子元素的最后一个 book 元素。
    /bookstore/book[last()-1]选取属于 bookstore 子元素的倒数第二个 book 元素。
    /bookstore/book[position()<3]选取最前面的两个属于 bookstore 元素的子元素的 book 元素。
    //title[@lang]选取所有拥有名为lang的属性的title元素
    //title[@lang='eng']选取所有title元素,且这些元素拥有值为eng的lang属性
    /bookstore/book[price>35.00]选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00。
    /bookstore/book[price>35.00]/title选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00。

4.2 获取sys-config.xml文件的配置信息

准备工作

  • 导入dom4j-1.6.1.jar 和 jaxen-1.1-beta-7.jar

  • sys-config.xml文档

    <?xml version="1.0" encoding="UTF-8"?>
    <config>
        <database-info>
            <driver-name>com.mysql.jdbc.Driver</driver-name>
            <url>jdbc:mysql://192.168.1.151:3366/bjpowernode</url>
            <user>root</user>
            <password>123</password>
        </database-info>
    </config>

解析步骤

package com.hhb.xml;
​
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
​
public class SysConfigTest {
    public static void main(String[] args) throws Exception{
        //创建解析器
        SAXReader reader = new SAXReader();
        //通过解析器的read方法将配置文件读取到内存中,生成一个Document对象树
        Document document = reader.read("C:\\Users\\Administrator\\IdeaProjects\\xml1\\conf\\sys-config.xml");
        //获取driver-name节点元素对象的文本内容
        Element driverNameElt = (Element) document.selectSingleNode("/config/database-info/driver-name");
        String driverName = driverNameElt.getStringValue();
        System.out.println(driverName);
        //获取url节点元素对象的文本内容
        Element urlElt = (Element) document.selectSingleNode("config//url");
        String url = urlElt.getStringValue();
        System.out.println(url);
        //获取user节点
        Element userElt = (Element) document.selectSingleNode("//user");
        String user = userElt.getText();
        System.out.println(user);
        //获取password节点
        Element passwordElt = (Element) document.selectSingleNode("//password");
        String password = passwordElt.getTextTrim();
        System.out.println(password);
    }
}

4.3 获取server.xml文件的配置信息

package com.hhb.xml;
​
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
​
public class ServerTest {
    public static void main(String[] args) throws Exception{
        //创建解析器
        SAXReader reader = new SAXReader();
        //通过解析器的read方法将配置文件读到内存中,生成一个Document对象树
        Document document = reader.read("C:\\Users\\Administrator\\IdeaProjects\\xml1\\conf\\server.xml");
        //获取connector节点元素对象的路径
        Element connectorElt = (Element) document.selectSingleNode("//connector");
        //获取connectorElt节点元素对象的port属性对象
       // Attribute portAttr = connectorElt.attribute("port");
        //获取portAttr属性对象的值
        //String port = portAttr.getStringValue();
        String port = connectorElt.attributeValue("port");
        System.out.println(port);
    }
}
​

4.4 获取bookstore.xml文件的配置信息

package com.hhb.xml;
​
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
​
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathFactory;
​
public class BookTest {
    public static void main(String[] args) throws Exception {
        //创建解析工厂
        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
        //创建解析器
        DocumentBuilder builder = documentBuilderFactory.newDocumentBuilder();
        //创建解析器读取配置文件,生成一个Document对象树
        Document document = builder.parse("C:\\Users\\Administrator\\IdeaProjects\\xml1\\conf\\bookstore.xml");
        //创建XPath对象
        XPath xPath = XPathFactory.newInstance().newXPath();
​
        //获取bookstore节点下book属性category值为web的title属性为en的节点内容
        //bookstore -> book[@category='web'] -> title[@lang='en']
        String titleLangXpath = "/bookstore/book[@category='web']/title[@lang='en']";
        String titleLangValue = (String) xPath.evaluate(titleLangXpath, document, XPathConstants.STRING);
        System.out.println(titleLangValue);
​
        //获取bookstore节点下book属性category值为web下的第二个title节点的文本内容
        String titleXpath="/bookstore/book[@category='web'][2]/title/text()";
        String titleValue = (String) xPath.evaluate(titleXpath, document, XPathConstants.STRING);
        System.out.println(titleValue);
​
        //获取bookstore下book属性category值为cooking的title的lang属性的值
        String titleLangAttrXpath="/bookstore/book[@category='cooking']/title/@lang";
        String titleLangAttrValue = (String) xPath.evaluate(titleLangAttrXpath, document, XPathConstants.STRING);
        System.out.println(titleLangAttrValue);
​
        //获取bookstore节点下所有book的节点集合
        NodeList bookList = (NodeList) xPath.evaluate("/bookstore/book", document, XPathConstants.NODESET);
        //开始遍历bookList
        for (int i=0;i<bookList.getLength();i++){
            Element bookElt = (Element) bookList.item(i);
            String titleValue01 = (String) xPath.evaluate("title", bookElt, XPathConstants.STRING);
            String authorValue = (String) xPath.evaluate("author", bookElt, XPathConstants.STRING);
            String year = (String) xPath.evaluate("year", bookElt, XPathConstants.STRING);
            String price = (String) xPath.evaluate("price", bookElt, XPathConstants.STRING);
            System.out.println(titleValue01+" "+authorValue+" "+year+" "+price);
            System.out.println("-------------------------------------------");
        }
    }
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/750517.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

s3fs安装使用

s3fs安装使用 前言 最近在预研将对象存储桶挂载到本地文件系统的需求&#xff0c;查阅了一些相关的资料&#xff0c;找到s3fs-fuse开源组件&#xff0c;可以满足需求&#xff0c;本文主要记录一下s3fs的部署以及使用。 s3fs简介 s3fs 是一个 C 开发的开源工具&#xff0c;可…

Amplify-Shader-Pack下载

ASE相关效果资源https://download.csdn.net/download/mayzhengxi/87915649?spm1001.2014.3001.5503

[linux] ebtables技术

Linux系统中使用ebtables技术 ebtables就是以太网桥防火墙&#xff0c;以太网桥工作在数据链路层&#xff08;MAC层&#xff09;&#xff0c;ebtables主要过滤数据链路层数据包&#xff0c;ebtables能过滤桥接流量。ebtables每个阶段的过滤时机都比iptables早。 ebtables的配置…

centos7.9修改ssh默认的端口号

多开几个ssh&#xff0c;防止配置文件错误&#xff0c;将自己关在服务器外面了 netstat -ntlp|grep ssh # ssh对应的端口号 修改sshd_config配置文件 /etc/ssh/sshd_config&#xff0c;重启sshd服务 #Port 22 Port 10011 # 端口号自己定义&#xff0c;不能超过65535&#xf…

基于Java+Swing+Mysql影院购票系统

基于JavaSwingMysql影院购票系统 一、系统介绍二、功能展示1.用户登陆2.用户订票管理3.电影售票中心4.电影上映管理4.退票记录查询 三、数据库四、其他系统实现五、获取源码 一、系统介绍 该系统实现了查看管理员登陆、用户订票管理、电影上映管理、电影售票中心、退票记录查询…

重定义/自定义printf到串口输出实现的三种方法(cubeide)

重定义/自定义printf到串口输出实现的三种方法&#xff08;cubeide) 文章目录 重定义/自定义printf到串口输出实现的三种方法&#xff08;cubeide)1.重写_write函数2.重定义PUTCHAR_PROTOTYPE宏3.va_list自定义printf总结&#xff1a; 1.重写_write函数 注释掉syscalls.c文件中…

Java中Map使用增强for循环和迭代器获取key和value

加油&#xff0c;新时代打工人&#xff01; java中List集合三种获取集合元素方式 本文运行代码使用 jdk1.8 for 语句比较简单&#xff0c;用于循环数据。 Java迭代器&#xff08;Iterator&#xff09;是 Java 集合框架中的一种机制&#xff0c;是一种用于遍历集合&#xff08…

非线程安全问题

目录 实例变量共享导致的“非线程安全问题” 如何解决这个问题&#xff1f; i--与System.out.println()出现引起的“非线程安全问题” 非线程安全主要是指多个线程对同一个对象中的同一个实例变量进行操作时会出现值被更改、值不同步的情况&#xff0c;进而影响程序的执行流…

科目一速通技巧笔记,简记

常规 累计积分制度&#xff08;12满&#xff09;周期12月 虚假材料1年&#xff0c;假1吊二撤三醉五逃终身 假1500 骗三2k以下 初次领证1年实习期、实习标志&#xff0c;18~70岁 拼装车、报废车&#xff0c;吊销 200~2k 没有中心线&#xff08;一条路&#xff09;城市道路3…

路径规划算法:基于白鲸优化的路径规划算法- 附代码

路径规划算法&#xff1a;基于白鲸优化的路径规划算法- 附代码 文章目录 路径规划算法&#xff1a;基于白鲸优化的路径规划算法- 附代码1.算法原理1.1 环境设定1.2 约束条件1.3 适应度函数 2.算法结果3.MATLAB代码4.参考文献 摘要&#xff1a;本文主要介绍利用智能优化算法白鲸…

Python、STK、MATLAB的连接和使用

写在前面 预备知识&#xff1a; Python通过命令行调用MATLAB的简单实现。这篇文章讲明了如何使用 Python 调用 MATLAB 的原理和过程&#xff0c;并给出相应代码。 STK、MATLAB、SQL的连接和使用。这篇文章讲明了STK 11.2、MATLAB 2014a、SQL 2019的安装过程&#xff0c;以及…

超越99%的程序员,chatgpt用C++写个线程安全无锁环形队列

​肝了一个周末&#xff0c;我们一起来欣赏chatgpt写的代码吧。让其用C为我们写一个线程安全的环形队列&#xff0c;并逐步提出一些需求。 先看带锁的实现。 带锁版本 我对chatgpt的需求是&#xff1a; 用C实现线程安全的环形队列&#xff0c;提供代码注释&#xff0c;以及g…

Meetup 报名|07.22 StarRocks Friends 与你相约广州

夏日炎炎&#xff0c;经历了杭州和上海两站的成功活动后&#xff0c;社区开发者的热情依旧如火如荼&#xff01;在更加炽热的七月&#xff0c;我们即将迎来 StarRocks & Friends 的第三站--广州&#xff01; 社区依旧秉持连接 StarRocks 社区专家与用户共同探讨大数据领域…

MySQL数据库 - 基本数据类型

目录 一、数据类型分类 二、数据类型 1、tinyint 类型 有符号 tinyint 范围测试 无符号 tinyint 范围测试 2、bit 类型 3、float 类型 有符号 float 范围测试 无符号 float 范围测试 4、decimal 类型 5、char 类型 6、varchar 类型 7、日期类型 8、enum类型、set类型…

Codeforces Round 739 (Div. 3)

A.Dislike of Threes AC代码&#xff1a; #include<iostream> #include<algorithm> #include<cstring> using namespace std; const int N2e510; int f[N]; int cnt; int main() {for(int i1;;i){if(i%3!0&&i%10!3) f[cnt]i;if(cnt>1000) break…

第一阶段-第六章 Python的数据容器

目录 一、数据容器入门  1.学习目标  2.为什么要学习数据容器  3.什么是数据容器  4.本小节的总结 二、数据容器&#xff1a;list&#xff08;列表&#xff09;  2.1列表的定义  1.学习目标  2.为什么需要列表  3.列表的定义  4.本节的代码演示  5.本小节的…

【Java练习题汇总】《第一行代码JAVA》面向对象基础篇,汇总Java练习题——面向对象:特性、类与对象、数组、String、内部类... ~

Java练习题 面向对象基础篇 1️⃣ 面向对象基础篇 1️⃣ 面向对象基础篇 一、填空题 面向对象的三大特征&#xff1a;_______ 、_______ 、_______。类由_______和_______组成。运算符_______的作用是根据对象的类型分配内存空间。当对象拥有内存空间时&#xff0c;会自动调…

oceanbase基础

与mysql对比 分布式一致性算法 paxos 存储结构&#xff08;引擎&#xff09;用的是两级的 数据库自动分片功能&#xff0c;提供独立的obproxy路由写入查询等操作到对应的分片 多租户 方便扩展 存储层 http://www.hzhcontrols.com/new-1391864.html LSM tree&#xff0c;is very…

CnOCR 使用教程

目录 一、 简介二、使用教程三、效果展示 一、 简介 CnOCR 是 Python 3 下的文字识别&#xff08;Optical Character Recognition&#xff0c;简称OCR&#xff09;工具包&#xff0c;支持简体中文、繁体中文&#xff08;部分模型&#xff09;、英文和数字的常见字符识别&#…

[COCI2010-2011#6]STEP

目录 1.题目&#xff1a; 题目描述 输入格式 输出格式 2.思路 1.ans数组的维护 2.L and R 的维护 3.ne数组与pr数组的维护 4.len数组&#xff1a; 3.代码&#xff1a; 1.有注释版&#xff1a; 2.copy版&#xff1a; 1.题目&#xff1a; 题目描述 给定一个长度为N的…