【Java 进阶篇】Java XML组成部分:理解XML的结构

news2024/9/20 21:00:12

在这里插入图片描述

XML(可扩展标记语言)是一种常用于存储和交换数据的标记语言。了解XML的结构和组成部分对于有效处理XML数据至关重要。在本篇博客中,我们将深入探讨XML的组成部分,以及如何使用Java来处理和操作XML数据。

什么是XML?

XML是一种标记语言,用于描述和存储数据。它的设计目标是可读性强、自解释、可扩展性好。XML文档包含标签、元素和属性,用于组织和描述数据。

XML的主要特点包括:

  • 自解释性:XML文档通常包含有关数据的描述,标签和元素名称通常清晰表达数据的含义,使其易于理解。

  • 层次性:XML数据以层次结构的方式组织,可以包含嵌套元素,形成父子关系,非常适合表示树状结构的数据。

  • 可扩展性:用户可以自定义标签和规则,因此XML适用于各种领域,从配置文件到数据交换。

  • 与平台无关:XML是一种与编程语言和操作系统无关的格式,因此可以在不同平台上读取和解析XML数据。

XML的基本结构

XML文档由以下几个基本部分组成:

  1. XML声明:XML文档通常以一个XML声明开始,用于指定XML的版本和字符编码。例如:

    <?xml version="1.0" encoding="UTF-8"?>
    
  2. 根元素:XML文档的根元素包含所有其他元素,是XML文档的起点。它位于XML文档的顶部,并用标签表示。例如:

    <bookstore>
        <!-- 此处包含书籍信息 -->
    </bookstore>
    
  3. 元素:元素是XML文档中的基本构建块,由开始标签、结束标签和元素内容组成。例如:

    <title>Java编程入门</title>
    

    其中<title>是开始标签,</title>是结束标签,中间的文本 “Java编程入门” 是元素的内容。

  4. 属性:元素可以包含属性,属性提供有关元素的附加信息。属性位于元素的开始标签中,通常由名称和值组成。例如:

    <book ISBN="123456789">
        <!-- 此处包含书籍信息 -->
    </book>
    

    其中ISBN是属性的名称,123456789是属性的值。

  5. 注释:注释用于向XML文档添加注释性信息,不会被解析为数据。注释以<!--开始,以-->结束。例如:

    <!-- 这是一条注释 -->
    
  6. CDATA部分:CDATA(字符数据)部分用于包含文本数据,不会被解析为元素或实体。CDATA部分以<![CDATA[开始,以]]>结束。例如:

    <![CDATA[这是一段特殊的文本,不会被解析。]]>
    

XML的层次结构

XML文档的结构是层次性的,元素可以嵌套在其他元素内,形成层次结构。每个元素都有一个父元素,除了根元素,它没有父元素。

例如,考虑以下XML文档的结构:

<bookstore>
    <book>
        <title>Java编程入门</title>
        <author>小明</author>
        <price>29.99</price>
    </book>
    <book>
        <title>Python入门教程</title>
        <author>小红</author>
        <price>24.99</price>
    </book>
</bookstore>

在这个XML文档中,<bookstore>是根元素,它包含两个子元素<book>,每个<book>又包含三个子元素<title><author><price>。这种嵌套关系构成了XML文档的层次结构。

使用Java处理XML

Java提供了多种方式来处理XML数据,其中两种主要的是DOM解析和SAX解析。

DOM解析

DOM(文档对象模型)解析将整个XML文档加载到内存中,创建一个树状结构的文档对象模型。这种方式允许您以面向对象的方式访问和操作XML文档,但需要占用大量内存,因此不适合处理大型XML文件。

以下是一个使用DOM解析XML的示例:

import org.w3c.dom.*;
import javax.xml.parsers.*;
import java.io.*;

public class DomParserExample {
    public static void main(String[] args) {
        try {
            File inputFile = new File("books.xml");
            DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
            DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
            Document doc = dBuilder.parse(inputFile);
            doc.getDocumentElement().normalize();
            NodeList bookList = doc.getElementsByTagName("book");
            for (int temp = 0; temp < bookList.getLength(); temp++) {
                Node nNode = bookList.item(temp);
                if (nNode.getNodeType() == Node.ELEMENT_NODE) {
                    Element eElement = (Element) nNode;
                    System.out.println("Title: " + eElement.getElementsByTagName("title").item(0).getTextContent());
                    System.out.println("Author: " + eElement.getElementsByTagName("author").item(0).getTextContent());
                    System.out.println("Price: " + eElement.getElementsByTagName("price").item(0).getTextContent());
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
   继续上述代码的示例:

```java
    }
}

在上面的示例中,我们使用DOM解析读取XML文件中的书籍信息。

SAX解析

SAX(简单API for XML)解析是一种事件驱动的解析方式,它逐行读取XML文档,触发事件来处理不同部分的数据。相比DOM,SAX解析占用较少内存,因此适合处理大型XML文件。

以下是一个使用SAX解析XML的示例:

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.*;
import java.io.*;

public class SaxParserExample {
    public static void main(String[] args) {
        try {
            File inputFile = new File("books.xml");
            SAXParserFactory factory = SAXParserFactory.newInstance();
            SAXParser saxParser = factory.newSAXParser();
            DefaultHandler handler = new DefaultHandler() {
                boolean bTitle = false;
                boolean bAuthor = false;
                boolean bPrice = false;

                public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
                    if (qName.equalsIgnoreCase("title")) {
                        bTitle = true;
                    }
                    if (qName.equalsIgnoreCase("author")) {
                        bAuthor = true;
                    }
                    if (qName.equalsIgnoreCase("price")) {
                        bPrice = true;
                    }
                }

                public void characters(char ch[], int start, int length) throws SAXException {
                    if (bTitle) {
                        System.out.println("Title: " + new String(ch, start, length));
                        bTitle = false;
                    }
                    if (bAuthor) {
                        System.out.println("Author: " + new String(ch, start, length));
                        bAuthor = false;
                    }
                    if (bPrice) {
                        System.out.println("Price: " + new String(ch, start, length));
                        bPrice = false;
                    }
                }
            };
            saxParser.parse(inputFile, handler);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

在上面的示例中,我们使用SAX解析读取XML文件中的书籍信息。

生成XML

生成XML是将Java对象转换为XML文档的过程。Java提供了多种方式来生成XML,其中一种常用的方式是使用DOM库。

以下是一个使用DOM库生成XML的示例:

import org.w3c.dom.*;
import javax.xml.parsers.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;

public class DomXmlWriterExample {
    public static void main(String[] args) {
        try {
            DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
            DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
            Document doc = dBuilder.newDocument();

            // 创建根元素
            Element rootElement = doc.createElement("bookstore");
            doc.appendChild(rootElement);

            // 创建书籍元素
            Element bookElement = doc.createElement("book");
            rootElement.appendChild(bookElement);

            // 创建标题元素
            Element titleElement = doc.createElement("title");
            titleElement.appendChild(doc.createTextNode("Java编程入门"));
            bookElement.appendChild(titleElement);

            // 创建作者元素
            Element authorElement = doc.createElement("author");
            authorElement.appendChild(doc.createTextNode("小明"));
            bookElement.appendChild(authorElement);

            // 创建价格元素
            Element priceElement = doc.createElement("price");
            priceElement.appendChild(doc.createTextNode("29.99"));
            bookElement.appendChild(priceElement);

            // 将文档写入XML文件
            TransformerFactory transformerFactory = TransformerFactory.newInstance();
            Transformer transformer = transformerFactory.newTransformer();
            DOMSource source = new DOMSource(doc);
            StreamResult result = new StreamResult(new File("new_books.xml"));
            transformer.transform(source, result);

            System.out.println("XML文件已生成!");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

在上面的示例中,我们创建了一个新的XML文档,并使用DOM库构建XML结构,然后将文档写入名为 “new_books.xml” 的文件。

操作XML

除了解析和生成XML,Java还提供了操作XML文档的能力。您可以使用DOM或其他库来遍历、修改和查询XML数据。

以下是一个使用DOM库操作XML的示例:

import org.w3c.dom.*;
import javax.xml.parsers.*;
import java.io.*;

public class DomXmlModifierExample {
    public static void main(String[] args) {
        try {
            File inputFile = new File("books.xml");
            DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
            DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
            Document doc = dBuilder.parse(inputFile);
            doc.getDocumentElement().normalize();

            // 获取根元素
            Element root = doc.getDocumentElement();

            // 添加新书籍
            Element newBook = doc.createElement("book");
            Element title = doc.createElement("title");
            title.appendChild(doc.createTextNode("新书标题"));
            Element author = doc.createElement("author");
            author.appendChild(doc.createTextNode("新书作者"));
            Element price = doc.createElement("price");
            price.appendChild(doc.createTextNode("19.99"));
            newBook.appendChild(title);
            newBook.appendChild(author);
            newBook.appendChild(price);
            root.appendChild(newBook);

            // 修改现有书籍
            NodeList bookList = doc.getElementsByTagName("book");
            for (int temp = 0; temp < bookList.getLength(); temp++) {
                Node bookNode = bookList.item(temp);
                if (bookNode.getNodeType() == Node.ELEMENT_NODE) {
                    Element bookElement = (Element) bookNode;
                    if (bookElement.getElementsByTagName("title").item(0).getTextContent().equals("Java编程入门")) {
                        Element newPrice = doc.createElement("price");
                        newPrice.appendChild(doc.createTextNode("25.00"));
                        bookElement.appendChild(newPrice);
                    }
                }
            }

            // 删除书籍
            NodeList bookListToRemove = doc.getElementsByTagName("book");
            for (int temp = 0; temp < bookListToRemove.getLength(); temp++) {
                Node bookNode = bookListToRemove.item(temp);
                if (bookNode.getNodeType() == Node.ELEMENT_NODE) {
                    Element bookElement = (Element) bookNode;
                    if (bookElement.getElementsByTagName("title").item(0).getTextContent().equals("新书标题")) {
                        root.removeChild(bookNode);
                    }
                }
            }

            // 将文档写回XML文件
            TransformerFactory transformerFactory = TransformerFactory.newInstance();
            Transformer transformer = transformerFactory.newTransformer();
            DOMSource source = new DOMSource(doc);
            StreamResult result = new StreamResult(new File("modified_books.xml"));
            transformer.transform(source, result);

            System.out.println("XML文件已修改!");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

在上面的示例中,我们打开一个XML文件,然后添加新书籍、修改现有书籍和删除书籍,最后将文档写回到XML文件中。

实际应用示例

让我们来看一个实际的应用示例:使用Java解析RSS订阅。RSS是一种常见的数据格式,用于发布博客文章、新闻等内容。我们可以使用Java解析并显示RSS订阅中的文章标题和链接。

首先,创建一个RSS订阅文件 rss_feed.xml,并添加一些文章项:

<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
    <channel>
        <title>示例RSS订阅</title>
        <link>http://example.com/rss</link>
        <description>这是一个示例RSS订阅</description>
        <item>
            <title>文章1标题</title>
            <link>http://example.com/article1</link>
        </item>
        <item>
            <title>文章2标题</title>
            <link>http://example.com/article2</link>
        </item>
    </channel>
</rss>

接下来,我们可以编写Java代码来解析并显示RSS订阅的文章:

import org.w3c.dom.*;
import javax.xml.parsers.*;
import java.io.*;

public class RssReaderExample {
    public static void main(String[] args) {
        try {
            File inputFile = new File("rss_feed.xml");
            DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
            DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
            Document doc = dBuilder.parse(inputFile);
            doc.getDocumentElement().normalize();

            Element channel = (Element) doc.getElementsByTagName("channel").item(0);
            System.out.println("订阅标题: " + channel.getElementsByTagName("title").item(0).getTextContent());
            System.out.println("订阅链接: " + channel.getElementsByTagName("link").item(0).getTextContent());
            System.out.println("订阅描述: " + channel.getElementsByTagName("description").item(0).getTextContent());
            System.println("文章列表:");

            NodeList items = doc.getElementsByTagName("item");
            for (int i = 0; i < items.getLength(); i++) {
                Element item = (Element) items.item(i);
                System.out.println("标题: " + item.getElementsByTagName("title").item(0).getTextContent());
                System.out.println("链接: " + item.getElementsByTagName("link").item(0).getTextContent());
                System.out.println("---------------");
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

在上面的示例中,我们解析了一个包含文章标题和链接的RSS订阅文件,并将这些信息显示在控制台上。

总结

本篇博客详细介绍了XML的基本结构和组成部分,以及如何使用Java来解析和生成XML数据。我们了解了两种主要的XML解析方式:DOM解析和SAX解析,并演示了如何操作XML文档。最后,我们还探讨了一个实际应用示例,演示了如何使用Java解析RSS订阅。无论您是初学者还是有经验的开发人员,这些基础知识都将帮助您更好地理解和处理XML数据,为您的项目带来便利。希望这篇博客对您有所帮助!

作者信息

作者 : 繁依Fanyi
CSDN: https://techfanyi.blog.csdn.net
掘金:https://juejin.cn/user/4154386571867191

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1122878.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

预测宝可梦武力值、分类宝可梦

regression case 股票预测 无人车看到的各种sensor 影像镜头看到马路上的东西作为输入&#xff0c;输出就是方向盘角度等等的操纵策略 scalar 标量 这个是热力图&#xff0c;相当于你的XYZ但是Z用颜色表示了 closed-form solution 闭合解 learning rate事先定好的数值 在lin…

Vue中的v-for指令是用来做什么的?

在Vue中,v-for是一个用于渲染列表或集合的指令。它通过迭代数据源中的每个元素,生成对应的DOM节点或组件实例,并将它们渲染到页面上。 v-for指令的基本语法如下: <template><div><ul><li v-for="item in items" :key="item.id"…

基于ssm流浪动物领养救助系统

摘要 基于SSM&#xff08;Spring SpringMVC MyBatis&#xff09;的流浪动物领养救助系统是一个用于管理和帮助流浪动物领养、救助的信息化平台。该系统旨在提供一种便捷、高效的方式&#xff0c;以协调和改善流浪动物的生活&#xff0c;并促进社会各界的参与和支持。以下是该…

重生奇迹mu“荣誉之城”勇者大陆

曾经&#xff0c;不少重生奇迹mu玩家讨论最经典的新人出生地&#xff0c;有的说是仙踪林&#xff0c;有的则是说勇者大陆&#xff0c;最后在重生奇迹mu网站上面&#xff0c;以投票的方式最终得出一个答案&#xff0c;那就是勇者大陆&#xff0c;游戏里面当之无愧的荣誉之城&…

c语言程序设计——题目:将一个正整数分解质因数。例如:输入90,打印出90=2*3*3*5。

题目&#xff1a;将一个正整数分解质因数。例如&#xff1a;输入90,打印出902*3*3*5。 程序分析&#xff1a;对n进行分解质因数&#xff0c;应先找到一个最小的质数k&#xff0c;然后按下述步骤完成 (1)如果这个质数恰等于&#xff08;小于的时候&#xff0c;继续执行循环&…

C#,数值计算——分类与推理Phylo_nj的计算方法与源程序

1 文本格式 using System; using System.Collections.Generic; namespace Legalsoft.Truffer { public class Phylo_nj : Phylagglom { public double[] u; public override void premin(double[,] d, int[] nextp) { i…

spring6-国际化:i18n | 数据校验:Validation

文章目录 1、国际化&#xff1a;i18n1.1、i18n概述1.2、Java国际化1.3、Spring6国际化1.3.1、MessageSource接口1.3.2、使用Spring6国际化 2、数据校验&#xff1a;Validation2.1、Spring Validation概述2.2、实验一&#xff1a;通过Validator接口实现2.3、实验二&#xff1a;B…

AI只需26秒,就可以设计一款会走路的机器人

由西北大学、麻省理工学院和佛蒙特大学组成的一支科研团队首次开发出一种可以完全自行设计机器人的 AI 算法。 这一 AI 算法不仅运行速度快&#xff0c;还可在个人计算机上运行&#xff0c;并从头开始设计全新的结构。只需告诉AI“我们想要一个可穿越陆地的机器人”&#xff0c…

【Java 进阶篇】Java XML快速入门:理解、解析和生成XML

XML&#xff08;可扩展标记语言&#xff09;是一种常用于存储和交换数据的标记语言&#xff0c;而Java是一种强大的编程语言&#xff0c;它具有处理XML的能力。在本篇博客中&#xff0c;我们将探讨XML的基础知识&#xff0c;学习如何在Java中解析和生成XML文档&#xff0c;以及…

一次OOM故障分析

一、前言 昨天门店POS系统发生了一次因为OOM引起的Down机事件&#xff0c;本文我们就来讲一下故障排查和解决问题过程。 二、故障发生 吃完中饭正在休息&#xff0c;业务方说POS的后台管理系统进行库存盘点出错&#xff0c;截图过来的报错信息里有&#xff1a;连接POS前台系…

《向量数据库》——向量数据库Milvus Cloud 和Dify比较

Zilliz Cloud v.s. Dify Dify 作为开源的 LLMs App 技术栈&#xff0c;在此前已支持丰富多元的大型语言模型的接入&#xff0c;除了 OpenAI、Anthropic、Azure OpenAI、Hugging face、Replicate 等全球顶尖模型及模型托管平台&#xff0c;也完成了国内主流的各大模型支持&#…

1024 CSDN 程序员节-知存科技-基于存内计算芯片开发板验证语音识别

前言 在今年的 CSDN 程序员节上&#xff0c;我参与了这次知存科技举办的一个 AI Workshop 小活动——“基于存内计算芯片开发板验证语音识别”&#xff0c;并且有幸成为完成任务的学习者之一XD。上一次参与类似的活动是算能公司举办的“千校万里行”AIGC 大模型编译部署活动&a…

logging日志改造---自定义参数传递到格式中

目录 一&#xff1a;需求二&#xff1a;实现方式三&#xff1a;存在的问题3.1: 问题描述3.2: 源码分析3.3: 解决方案 四&#xff1a;相关链接 一&#xff1a;需求 需求&#xff1a;将自定义的参数&#xff0c;放在日志的指定格式中。 二&#xff1a;实现方式 例如&#xff1…

三维模型表面积计算方法

【版权声明】 本文为博主原创文章&#xff0c;未经博主允许严禁转载&#xff0c;我们会定期进行侵权检索。 更多算法总结请关注我的博客&#xff1a;https://blog.csdn.net/suiyingy&#xff0c;或”乐乐感知学堂“公众号。 本文章来自于专栏《Python三维模型处理基础》的系列文…

【RocketMQ系列十】RocketMQ的核心概念说明

您好&#xff0c;我是码农飞哥&#xff08;wei158556&#xff09;&#xff0c;感谢您阅读本文&#xff0c;欢迎一键三连哦。 &#x1f4aa;&#x1f3fb; 1. Python基础专栏&#xff0c;基础知识一网打尽&#xff0c;9.9元买不了吃亏&#xff0c;买不了上当。 Python从入门到精…

【计网 DNS】计算机网络 DNS协议详解:中科大郑烇老师笔记 (六)

目录 0 引言1 DNS概述1.1 定义1.2 DNS域名结构1.2 域名解析步骤 &#x1f64b;‍♂️ 作者&#xff1a;海码007&#x1f4dc; 专栏&#xff1a;计算机四大基础专栏&#x1f4dc; 其他章节&#xff1a;网络快速入门系列、计算机网络&#xff08;一&#xff09;、计算机网络&…

初始Redis 分布式结构的发展演变

目录 Redis的特点和使用场景 分布式系统的引入 单机系统 分布式系统 应用服务器的增多&#xff08;处理更多的请求&#xff09; 数据库读写分离&#xff08;数据服务器的增多) 引入缓存 应对更大的数据量 业务拆分&#xff1a;微服务 Redis的特点和使用场景 我们先来…

使用 Rust 和 cURL 库下载程序

以下是一个使用 Rust 和 cURL 库的下载器程序&#xff0c;用于下载 图像。此程序使用了 https://www.duoip.cn/get_proxy 的代码。 extern crate curl; ​ use std::io::{self, Read}; use std::error::Error; ​ fn main() {let url "https://www.baidu.com";let …

04-HotSpot 垃圾收集器

HotSpot 垃圾收集器 HotSpot 虚拟机提供了多种垃圾收集器&#xff0c;每种收集器都有各自的特点&#xff0c;虽然我们要对各个收集器进行比较&#xff0c;但并非为了挑选出一个最好的收集器。我们选择的只是对具体应用最合适的收集器。 新生代垃圾收集器 Serial 垃圾收集器&…

如何将表格内容拆分至多列内容

如何将表格内容拆分至多列内容 需求示例步骤1.找到“分列”2.选择“分隔符号&#xff08;D&#xff09;”3.设置分隔符号4.完成5.分隔后的内容 总结 需求 表格的某一列里有很多内容&#xff0c;想将该列内容拆分到多列里&#xff0c;并能准确的显示拆分后的每一列内容 示例 …