JavaSE XML解析技术的使用详解

news2024/12/23 17:28:14

文章目录

  • XML解析技术
    • XML解析技术介绍
    • Dom4j解析XML文件
    • Dom4j解析各个节点
    • Dom4j解析案例实战

XML解析技术

XML解析技术介绍

XML的数据作用是什么? 最终需要怎样处理?

作用: 存储数据、做配置信息、进行数据传输。

最终需要被程序进行读取,解析里面的信息。

XML解析就是使用程序读取XML中的数据:

在这里插入图片描述

有两种解析方式:

SAX解析

DOM解析(我们重点学习DOM解析)

DOM常见的解析工具:

名称说明
JAXPSUN公司提供的一套XML的解析的API
JDOMJDOM是一个开源项目,它基于树型结构,利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作。
dom4j是JDOM的升级品,用来读写XML文件的。具有性能优异、功能强大和极其易使用的特点,它的性能超过sun公司官方的dom 技术,同时它也是一个开放源代码的软件,Hibernate也用它来读写配置文件。
jsoup功能强大DOM方式的XML解析开发包,尤其对HTML解析更加方便

DOM解析, 解析文档对象模型如下:

在这里插入图片描述

其中:

  • Document对象: 代表整个xml文档对象
  • Element对象: 代表元素(标签), 例如上面student, name, age等等
  • Attribute对象: 代表属性, 例如上面的id
  • Text对象: 代表文本内容, 例如上面张三, 李四等等

Element、Attribute、Text对象都是一个Node节点, 实现了Node接口

Dom4j解析XML文件

Dom4j下载及导入:

下载Dom4j框架,官网下载。

在项目中创建一个文件夹:lib

将dom4j-2.1.1.jar文件复制到 lib 文件夹

在jar文件上点右键,选择 Add as Library -> 点击OK

在类中导包使用

案例:

使用Dom4J把一个XML文件的数据进行解析

Dom4j解析XML-得到Document对象:

SAXReader类

构造器/方法说明
SAXReader()创建Dom4J的解析器对象
read(String url)加载XML文件成为Document对象

Document类

方法名说明
getRootElement()获得根元素对象

实现步骤:

步骤一: 准备一个XML文件

<?xml version="1.0" encoding="UTF-8"?>
<books>
    <book id="0001" desc="我是第一本书">
        <name>     JavaWeb开发教程</name>
        <author> 张孝祥    </author>
        <sale>100.00元</sale>
    </book>
    <book id="0002">
        <name>三国演义</name>
        <author>罗贯中</author>
        <sale>100.00元</sale>
    </book>
    <sql>
        select * from user where age >= 18
    </sql>
</books>

步骤二: 创建一个Domj解析器对象, 加载XML文件称为Document对象

步骤三: 获取根元素对象

public static void main(String[] args) throws Exception {
    // 1. 创建一个Dom4j解析对象
    SAXReader saxReader = new SAXReader();
    // 把XML文件加载到内存中成为一个Document对象
    // Document document = saxReader.read(new File("/Users/chenyq/Documents/learn_Java/code/JavaSE/xml-app/src/books.xml"));
    InputStream is = Dom4jDemo.class.getResourceAsStream("/books.xml");
    Document document = saxReader.read(is);

    // 2. 获取根元素对象
    Element root = document.getRootElement();
}

Dom4j解析各个节点

Dom4j解析XML的元素、属性、文本的方法如下:

方法名说明
List<Element> elements()得到当前元素下所有子元素
List<Element> elements(String name)得到当前元素下指定名字的子元素返回集合
Element element(String name)得到当前元素下指定名字的子元素,如果有很多名字相同的返回第一个
String getName()得到元素名字
String attributeValue(String name)通过属性名直接得到属性值
String elementText(子元素名)得到指定名称的子元素的文本
String getText()得到文本

演示代码:

public static void main(String[] args) throws Exception {
    SAXReader saxReader = new SAXReader();
    InputStream is = Dom4jDemo.class.getResourceAsStream("/books.xml");
    Document document = saxReader.read(is);

    Element root = document.getRootElement();

    // 获取根元素下的所有子元素
    List<Element> allsonEls = root.elements();
    // 打印子元素的名称
    for (Element allsonEl : allsonEls) {
        System.out.println(allsonEl.getName()); // book book sql
    }

    // 获取当前元素下指定名字的子元素返回的集合
    List<Element> bookEls = root.elements("book");
    for (Element bookEl : bookEls) {
        System.out.println(bookEl.getName()); // book book
    }

    // 得到当前元素下指定名字的子元素,如果有很多名字相同的返回第一个
    Element bookEL = root.element("book");
    System.out.println(bookEL.getName()); // book

    // 通过属性名获取属性值
    System.out.println(bookEL.attributeValue("id")); // 0001

    // 得到指定名称的子元素的文本
    System.out.println(bookEL.elementText("name")); //      JavaWeb开发教程

    // 得到文本
    System.out.println(bookEL.element("sale").getText()); // 100.00元
}

Dom4j解析案例实战

需求:

利用Dom4J的知识,将Contact.xml文件中的联系人数据封装成List集合,其中每个元素是实体类Contact。打印输出 List 中的每个元素。

Contact.xml文件内容如下:

<?xml version="1.0" encoding="UTF-8"?>
<contactList>
    <contact id="1">
        <name>潘金莲</name>
        <gender></gender>
        <email>panpan@itcast.cn</email>
    </contact>
    <contact id="2">
        <name>武松</name>
        <gender></gender>
        <email>wusong@itcast.cn</email>
    </contact>
    <contact id="3">
        <name>武大狼</name>
        <gender></gender>
        <email>wuda@itcast.cn</email>
    </contact>
    <user>
    </user>
</contactList>

要求打印结果如下图所示:

在这里插入图片描述

实现步骤如下:

步骤一: 创建一个Contact类

public class Contact {
    private int id;
    private String name;
    private char gender;
    private String email;

    public Contact() {}

    public Contact(int id, String name, char gender, String email) {
        this.id = id;
        this.name = name;
        this.gender = gender;
        this.email = email;
    }

    public int getId() {
        return id;
    }

    public void setId(int id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public char getGender() {
        return gender;
    }

    public void setGender(char gender) {
        this.gender = gender;
    }

    public String getEmail() {
        return email;
    }

    public void setEmail(String email) {
        this.email = email;
    }

    @Override
    public String toString() {
        return "Contact{" +
                "id=" + id +
                ", name='" + name + '\'' +
                ", gender=" + gender +
                ", email='" + email + '\'' +
                '}';
    }
}

步骤二: 在主类中进行下面操作

  • 创建Dom4j解析器, 加载XML文件为Document对象
  • 获取根元素对象
  • 获取所有的contact元素
  • 准备一个集合装contact对象, 遍历所有的contact元素, 获取类的成员变量的值添加到List集合中
public static void main(String[] args) throws Exception {
    // 创建Dom4j解析器, 加载XML文件为Document对象
    SAXReader saxReader = new SAXReader();
    InputStream is = Dom4jDemo.class.getResourceAsStream("/Contacts.xml");
    Document document = saxReader.read(is);
    // 获取根元素对象
    Element root = document.getRootElement();

    // 获取所有的contact元素
    List<Element> contactELs = root.elements("contact");
    // 准备一个集合装contact对象
    List<Contact> contacts = new ArrayList<>();
    // 遍历contactELs
    int id = 0;
    for (Element contactEL : contactELs) {
        Contact contact = new Contact();
        contact.setId(Integer.valueOf(contactEL.attributeValue("id")));
        contact.setName(contactEL.elementText("name"));
        contact.setGender(contactEL.elementText("gender").charAt(0));
        contact.setEmail(contactEL.elementText("email"));

        // 加入到List集合
        contacts.add(contact);
    }
    // 遍历集合
    for (Contact contact : contacts) {
        System.out.println(contact);
    }
}

打印结果

Contact{id=1, name='潘金莲', gender=女, email='panpan@itcast.cn'}
Contact{id=2, name='武松', gender=男, email='wusong@itcast.cn'}
Contact{id=3, name='武大狼', gender=男, email='wuda@itcast.cn'}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/342052.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【路径规划】基于A*算法和Dijkstra算法的路径规划(Python代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

Python蓝桥杯训练:基本数据结构 [链表]

Python蓝桥杯训练&#xff1a;基本数据结构 [链表] 文章目录Python蓝桥杯训练&#xff1a;基本数据结构 [链表]一、链表理论基础知识二、有关链表的一些常见操作三、力扣上面一些有关链表的题目练习1、[移除链表元素](https://leetcode.cn/problems/remove-linked-list-element…

TCP报头详解及TCP十种核心机制(一)

目录 前言&#xff1a; TCP报头 TCP核心机制 一、确认应答 二、超时重传 小结&#xff1a; 前言&#xff1a; 这篇文章详细介绍了TCP报头中的一些核心数据&#xff0c;及两种TCP核心机制。其他的一些机制会在后面文章中详细介绍。 TCP报头 解释&#xff1a; 1&#xff…

电商仓储与配送云仓是什么?

仓库是整个供给链的关键局部。它们是产品暂停和触摸的点&#xff0c;耗费空间和时间(工时)。空间和时间反过来也是费用。经过开发数学和计算机模型来微调仓库的规划和操作&#xff0c;经理能够显著降低与产品分销相关的劳动力本钱&#xff0c;进步仓库空间应用率&#xff0c;并…

docker/docker-compose 安装mysql5.7

目录使用docker安装mysql5.7docker普通安装docker生产环境安装使用docker-compose 安装注意注意一:docker-compose权限问题注意二:docker pull 找不到镜像使用docker安装mysql5.7 docker普通安装 docker pull mysql:5.7 # 启动容器 docker run -p 3306:3306 --name mysql -e …

数组和对象的拷贝(复制)

复制必须要产生新的对象。以下代码不是复制。 const arr ["孙悟空", "猪八戒", "沙和尚"]const arr2 arr // 不是复制&#xff0c;只是将arr的值赋给arr2&#xff0c;他们指的还是一个对象console.log(arr) // 二者输出一样 console.log(…

数楼梯(加强版)

数楼梯(加强版) 题目背景: 小明一天放学回家,看到从1楼到2楼共有n个台阶,因为好奇,他想尝试一下总共有几种方案到二楼?他可以1步,2步,3步的跳,不能跳3步以上. 他试了很多次都没有解决这个问题,于是请求聪明的你帮忙解决这个问题. 题目描述: 1楼到2楼楼梯有n级台阶。小明每…

Learning C++ No.8【内存管理】

引言&#xff1a; 北京时间&#xff1a;2023/2/12/18:04&#xff0c;昨天下午到达学校&#xff0c;摆烂到现在&#xff0c;该睡睡&#xff0c;该吃吃&#xff0c;该玩玩&#xff0c;在一顿操作之下&#xff0c;目前作息调整好了一些&#xff0c;在此记录&#xff0c;2月11&…

C++基础(6) - 复合类型(下)

文章目录指针1、指针概述1.1 存储器和存储地址空间1.2 内存地址1.3 指针和指针变量2、声明和初始化指针变量2.1 指针变量的声明2.2 指针变量的初始化3、使用指针变量3.1 解除引用3.2 野指针和空指针4、指针的宽度和跨度4.1 自身类型和指向类型4.2 指针变量所取内容的宽度4.3 指…

chatGPT会是银弹吗

chatGP最近火的一塌糊涂&#xff0c;它通过语言生成技术和自然语言处理能力&#xff0c;帮助用户快速解决问题并生成内容。目前&#xff0c;这款工具现在已经拥有超过一亿的活跃用户&#xff0c;并且因其高效率和易用性而受到了广大用户的好评。 不过谷歌可就倒霉了&#xff0c…

Shells:一款功能强大的反向Shell快速生成工具

关于Shells Shells是一款功能强大的反向Shell快速生成工具&#xff0c;该工具由4ndr34z负责开发和维护&#xff0c;可以帮助广大研究人员轻松生成常用的反向Shell。如果你需要一种简单的方法来生成格式化的PowerShell以及Python反向Shell的话&#xff0c;Shells这款工具将是你…

【IPD】敏捷开发与IPD结合的实践培训课程「3月11-12日」

课程名称敏捷开发与 IPD结合的实践 (Agile Development - IPD and Agile Development Practice &#xff09;参加对象企业总工、技术总监、系统架构师、研发经理、测试经理、质量/品质经理、研发测试骨干&#xff0c;以及研发测试技术人员。课程背景软件系统的日益复杂化和用户…

C语言学习笔记-内存管理

这篇将讲解 C 中的动态内存管理。C 语言为内存的分配和管理提供了几个函数。这些函数可以在 <stdlib.h> 头文件中找到。 序号函数和描述1void calloc(int num, int size);在内存中动态地分配 num 个长度为 size 的连续空间&#xff0c;并将每一个字节都初始化为 0。所以…

2023的金三银四,测试员还能找到好工作吗?

按照往年的惯例&#xff0c;春节后复工的 3 月、4 月是人员跳槽最频繁的时候&#xff0c;俗称“金三银四”。然而&#xff0c;市场大环境的影响&#xff0c;很多行业感受到了一丝寒冷的气息。 我们以为受影响比较轻的互联网行业&#xff0c;头上也充满乌云&#xff0c;所谓互联…

ROS2机器人编程简述humble-第四章-BASIC DETECTOR .3

书中程序适用于turtlebot、husky等多种机器人&#xff0c;配置相似都可以用的。支持ROS2版本foxy、humble。基础检测效果如下&#xff1a;由于缺&#xffe5;&#xff0c;所有设备都非常老旧&#xff0c;都是其他实验室淘汰或者拼凑出来的设备。机器人控制笔记本是2010年版本。…

九龙证券|本周5只新股申购,特斯拉、蔚来、理想的供应商来A股了!

据现在组织&#xff0c;2月13日到17日共有5只新股申购&#xff0c;其间上证主板2只&#xff0c;深证主板1只&#xff0c;北交所2只。 2月14日发动打新的深证主板新股多利科技成立于2010年&#xff0c;是一家专心于轿车冲压零部件及相关模具的开发、出产与出售的企业。从2020年…

nodejs版本管理器nvm下载,安装详情

文章目录前言一、NVM下载二、NVM安装三.使用NVM安装nodejs1.NVM常用命令2.安装node3.使用node前言 安装nodejs方式有两种。 第一种&#xff1a;官网下载  通过nodejs官网https://nodejs.org/zh-cn/下载安装 &#xff0c;但有个缺陷&#xff0c;不同版本的nodejs无法顺利的切…

软件测试面试理论(超详细)

【面试理论知识】1、你的测试职业发展是什么? 测试经验越多&#xff0c;测试能力越高。所以我的职业发展是需要时间积累的&#xff0c;一步步向着高级测试工程师奔去。而且我也有初步的职业规划&#xff0c;前3年积累测试经验&#xff0c;按如何做好测试工程师的要点去要求自己…

Dubbo中应用级,与接口级配置中心的使用,包括单配置中心与多配置中心

接口级或应用级服务发现 Dubbo3 默认采用 “应用级服务发现 接口级服务发现” 的双注册模式 可以通过配置 dubbo.registry.register-modeinstance/interface/all 来改变注册行为。 instance &#xff1a; 应用级interface &#xff1a; 接口级all &#xff1a;两者都注册&a…

一文详解jvm之-Xms -Xmx -Xmn -Xss -XX:PermSize -XX:MaxPermSize等参数的设置和优化以及如何选择垃圾回收器

文章目录1. 文章引言2. 常见配置汇总2.1 Xmn Xms Xmx Xss的区别2.2 其他常见配置2.3 典型设置举例3. 回收器选择3.1 吞吐量优先的并行收集器3.2 响应时间优先的并发收集器3.3 辅助信息4. 参考文档1. 文章引言 我们经常在tomcat的catalina.bat或者catalina.sh中配置如下参数&am…