DOM解析XML:Java程序员的“乐高积木式“数据搭建

news2025/4/15 20:18:31

各位代码建筑师们!今天我们要玩一个把XML变成内存乐高城堡的游戏——DOM解析!和SAX那种"边看监控边破案"的刺激不同,DOM就像把整个乐高说明书一次性倒进大脑,然后慢慢拼装(内存:你不要过来啊!)


一、DOM原理:XML的"克隆人战争"

想象你要复制整个迪士尼乐园:

  1. 全量加载术
    把XML文件整个吞进内存,变成一颗节点树(就像把城堡图纸转成3D模型)

  2. 随机访问特权
    可以随时瞬移到任意角落:“我要修改第三块砖的颜色!”(而SAX只能从头看到尾)

  3. 修改超能力
    支持增删改查,像玩《模拟人生》一样随意改造XML世界


二、实战演练:用DOM搭建"程序员主题乐园"

项目蓝图(programmer_park.xml):

<主题乐园 名称="996快乐谷">
    <区域 类型="代码深渊" geohash="wx4g0b1">
        <设施 id="1">
            <名称>无限续杯咖啡厅</名称>
            <危险等级>★★★★☆</危险等级>
        </设施>
        <设施 id="2">
            <名称>需求变更过山车</名称>
            <危险等级>★★★★★</危险等级>
        </设施>
    </区域>
</主题乐园>

建筑师工具包(DomArchitect.java):

import org.w3c.dom.*;
import javax.xml.parsers.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

public class DomArchitect {
    public static void main(String[] args) throws Exception {
        // 装载整个乐园到内存
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();
        Document park = builder.parse("programmer_park.xml");

        // 打印所有危险设施
        NodeList rides = park.getElementsByTagName("设施");
        System.out.println("⚠️ 高危设施列表:");
        for (int i=0; i<rides.getLength(); i++) {
            Element ride = (Element) rides.item(i);
            String name = ride.getElementsByTagName("名称").item(0).getTextContent();
            String level = ride.getElementsByTagName("危险等级").item(0).getTextContent();
            System.out.println(name + " | 危险指数:" + level);
        }

        // 新增一个夺命设施
        Element newRide = park.createElement("设施");
        newRide.setAttribute("id", "3");
        
        Element name = park.createElement("名称");
        name.appendChild(park.createTextNode("Deadline蹦极台"));
        
        Element level = park.createElement("危险等级");
        level.appendChild(park.createTextNode("★★★★★★")); // 突破五星!

        newRide.appendChild(name);
        newRide.appendChild(level);
        park.getDocumentElement().getFirstChild().appendChild(newRide);

        // 保存修改后的乐园(小心内存泄漏!)
        Transformer transformer = TransformerFactory.newInstance().newTransformer();
        transformer.transform(new DOMSource(park), 
            new StreamResult("programmer_park_modified.xml"));
    }
}

运行结果:

⚠️ 高危设施列表:
无限续杯咖啡厅 | 危险指数:★★★★☆
需求变更过山车 | 危险指数:★★★★★

(生成的新XML会多出一个"Deadline蹦极台",危险指数突破天际!)


三、DOM vs SAX:建筑师与侦探的巅峰对决

DOM建筑师 🏗️SAX侦探 🕵️♂️
内存消耗需要搬来整个建材市场(全量加载)只带侦探工具包(流式处理)
操作方式可以随意拆墙装修(随机修改)只能做现场记录(只读)
响应速度装修前要先运材料(初始化慢)到达现场立即开工(启动快)
适用场景需要改结构的精致小别墅快速搜查犯罪现场的超大仓库

四、DOM操作三大"骚操作"

  1. XPath闪电定位
    用XPath直接空降到指定节点,像使用传送门:

    XPath xpath = XPathFactory.newInstance().newXPath();
    Node node = (Node) xpath.evaluate("//设施[名称='需求变更过山车']", 
        park, XPathConstants.NODE);
    
  2. 属性隐身术
    动态修改geohash坐标,让设施"瞬间移动":

    Element area = (Element) park.getElementsByTagName("区域").item(0);
    area.setAttribute("geohash", "wx4g0b9"); // 从深渊传送到厕所
    
  3. 节点克隆大法
    复制过山车并改名,省时省力:

    Node clonedRide = rides.item(1).cloneNode(true);
    ((Element)clonedRide).setAttribute("id", "4");
    clonedRide.getChildNodes().item(0).setTextContent("需求复活过山车");
    

五、DOM的致命陷阱

  1. 内存黑洞
    加载1GB的XML文件 ≈ 在内存里造航空母舰(小心OOM空袭!)

  2. 空白节点鬼打墙
    XML中的换行符会被视为Text节点,遍历时可能踩坑:

    // 错误示范:直接取第一个子节点可能是空白文本节点!
    // Element name = (Element) ride.getFirstChild();
    
    // 正确姿势:过滤文本节点
    NodeList children = ride.getChildNodes();
    for (int i=0; i<children.getLength(); i++) {
        if (children.item(i).getNodeType() == Node.ELEMENT_NODE) {
            Element child = (Element) children.item(i);
            // 处理真实节点
        }
    }
    
  3. 线程安全惊魂
    Document对象不是线程安全的!多个线程同时装修会拆了你的乐高城堡。


六、DOM哲学:内存即世界

  • 每个Element节点都是乐高积木
  • 每个Text节点都是积木上的贴纸
  • 每个Attribute都是积木的卡扣设计
  • 而内存溢出…是你野心太大想造死星的下场

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2334521.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从宇树摇操avp_teleoperate到unitree_IL_lerobot:如何基于宇树人形进行二次开发(含Open-TeleVision源码解析)

前言 如之前的文章所述&#xff0c;我司「七月在线」正在并行开发多个订单&#xff0c;目前正在全力做好每一个订单&#xff0c;因为保密协议的原因&#xff0c;暂时没法拿出太多细节出来分享 ​但可以持续解读我们所创新改造或二次开发的对象&#xff0c;即解读paper和开源库…

告别 ifconfig:为什么现代 Linux 系统推荐使用 ip 命令

告别 ifconfig&#xff1a;为什么现代 Linux 系统推荐使用 ip 命令 ifconfig 指令已经被视为过时的工具&#xff0c;不再是查看和配置网络接口的推荐方式。 与 netstat 被 ss 替代类似。 本文简要介绍 ip addr 命令的使用 简介ip ifconfig 属于 net-tools 包&#xff0c;这个…

MySQL——MVCC(多版本并发控制)

目录 1.MVCC多版本并发控制的一些基本概念 MVCC实现原理 记录中的隐藏字段 undo log undo log 版本链 ReadView 数据访问规则 具体实现逻辑 总结 1.MVCC多版本并发控制的一些基本概念 当前读&#xff1a;该取的是记录的最新版本&#xff0c;读取时还要保证其他并发事务…

Gateway-网关-分布式服务部署

前言 什么是API⽹关 API⽹关(简称⽹关)也是⼀个服务, 通常是后端服务的唯⼀⼊⼝. 它的定义类似设计模式中的Facade模式(⻔⾯模式, 也称外观模式). 它就类似整个微服务架构的⻔⾯, 所有的外部客⼾端访问, 都需要经过它来进⾏调度和过滤. 常⻅⽹关实现 Spring Cloud Gateway&a…

Docker部署MySQL大小写不敏感配置与数据迁移实战20250409

Docker部署MySQL大小写不敏感配置与数据迁移实战 &#x1f9ed; 引言 在企业实际应用中&#xff0c;尤其是使用Java、Hibernate等框架开发的系统&#xff0c;MySQL默认的大小写敏感特性容易引发各种兼容性问题。特别是在Linux系统中部署Docker版MySQL时&#xff0c;默认行为可…

面试题之网络相关

最近开始面试了&#xff0c;410面试了一家公司 问了我几个网络相关的问题&#xff0c;我都不会&#xff01;&#xff01;现在来恶补一下&#xff0c;整理到博客中&#xff0c;好难记啊&#xff0c;虽然整理下来了。在这里先祝愿大家在现有公司好好沉淀&#xff0c;定位好自己的…

[春秋云镜] Tsclient仿真场景

文章目录 靶标介绍&#xff1a;外网mssql弱口令SweetPotato提权上线CSCS注入在线用户进程上线 内网chisel搭建代理密码喷洒攻击映像劫持 -- 放大镜提权krbrelayup提权Dcsync 参考文章 考点: mssql弱口令SweetPotato提权CS注入在线用户进程上线共享文件CS不出网转发上线密码喷洒…

数据集 handpose_x_plus 3D RGB 三维手势 - 手工绘画 场景 draw picture

数据集 handpose 相关项目地址&#xff1a;https://github.com/XIAN-HHappy/handpose_x_plus 样例数据下载地址&#xff1a;数据集handpose-x-plus3DRGB三维手势-手工绘画场景drawpicture资源-CSDN文库

deskflow使用教程:一个可以让两台电脑鼠标键盘截图剪贴板共同使用的开源项目

首先去开源网站下载&#xff1a;Release v1.21.2 deskflow/deskflow 两台电脑都要下载这个文件 下载好后直接打开找到你想要的exe desflow.exe 然后你打开他&#xff0c;将两台电脑的TLS都关掉 下面步骤两台电脑都要完成&#xff1a; 电脑点开edit-》preferences 把这个取…

详解MYSQL表空间

目录 表空间文件 表空间文件结构 行格式 Compact 行格式 变长字段列表 NULL值列表 记录头信息 列数据 溢出页 数据页 当我们使用MYSQL存储数据时&#xff0c;数据是如何被组织起来的&#xff1f;索引又是如何组织的&#xff1f;在本文我们将会解答这些问题。 表空间文…

[Windows] 音速启动 1.0.0.0

[Windows] 音速启动 链接&#xff1a;https://pan.xunlei.com/s/VONiGZhtsxpPzze0lDIH-mR9A1?pwdxu7f# [Windows] 音速启动 1.0.0.0 音速启动是一款桌面管理软件&#xff0c;以仿真QQ界面的形式结合桌面工具的特点&#xff0c;应用于软件文件夹网址的快捷操作。

Hyper-V 虚拟机配置静态IP并且映射到局域网使用

环境 win11hyper-v麒麟v10 配置 编辑文件 vi /etc/sysconfig/network-scripts/ifcfg-eth0文件内容 GATEWAY 需要参考网络中配置的网关地址 TYPEEthernet PROXY_METHODnone BROWSER_ONLYno BOOTPROTOstatic DEFROUTEyes IPV4_FAILURE_FATALno IPV6INITyes IPV6_AUTOCONFyes …

操作系统基础:06 操作系统历史

我们前面已经讲过了操作系统的基本轮廓、启动过程以及系统调用等相关内容&#xff0c;就如同揭开了钢琴的盖子&#xff0c;对操作系统有了初步的表面认识。从现在起&#xff0c;我们要更深入地剖析操作系统&#xff0c;就像分解钢琴一样&#xff0c;探究其各个部分的构成、原理…

【大模型微调】如何解决llamaFactory微调效果与vllm部署效果不一致如何解决

以下个人没整理太全 一、生成式语言模型的对话模板介绍 使用Qwen/Qwen1.5-0.5B-Chat训练 对话模板不一样。回答的内容就会不一样。 我们可以看到例如qwen模型的tokenizer_config.json文件&#xff0c;就可以看到对话模板&#xff0c;一般同系列的模型&#xff0c;模板基本都…

【2025最新】windows本地部署LightRAG,完成neo4j知识图谱保存

之前在服务器部署neo4j失败&#xff0c;无奈只能在本地部署&#xff0c;导致后期所有使用的知识图谱数据都存在本地&#xff0c;这里为了节省时间&#xff0c;先在本地安装LigthRAG完成整个实验流程&#xff0c;后续在学习各种服务器部署和端口调用。从基础和简单的部分先做起来…

14、nRF52xx蓝牙学习(串口 UART 和 UARTE 外设应用)

一、UART 功能描述 串口 UART 也称为通用异步收发器。是各种处理器中常用了通信接口&#xff0c;在 nRF52 芯片中&#xff0c; UART 具有以下特点&#xff1a; ● 全双工操作 ● 自动流控 ● 奇偶校验产生第 9 位数据 串口 UART 的数据发送与接收流程 : ◆硬件配置…

DeepSeek轻松入门教程——从入门到精通

大家好&#xff0c;我是吾鳴。 今天吾鳴要给大家分享一份DeepSeek小白轻松入门指导手册——《DeepSeek 15天指导手册&#xff0c;从入门到精通》。指导手册分为基础入门对话篇、效率飞跃篇、场景实战篇、高手进化篇等&#xff0c;按照指导手册操作&#xff0c;DeepSeek从入门到…

Vue2 老项目升级 Vue3 深度解析教程

Vue2 老项目升级 Vue3 深度解析教程 摘要 Vue3 带来了诸多改进和新特性&#xff0c;如性能提升、组合式 API、更好的 TypeScript 支持等&#xff0c;将 Vue2 老项目升级到 Vue3 可以让项目获得这些优势。本文将深入解析升级过程&#xff0c;涵盖升级前的准备工作、具体升级步骤…

WXJ196微机小电流接地选线装置使用简单方便无需维护

WXJ196微机小电流接地选线装置&#xff0c;能在系统发生单相接地时&#xff0c;准确、迅速地选出接地线路母 线。使用简单方便&#xff0c;无需维护&#xff0c;可根据用户需要将相关信息通过通信接口传给上级监控系统&#xff0c; 适用于无人值守变电站。 2 功能及特点 全新的…

Java第四节:idea在debug模式夏改变变量的值

作者往期文章 Java第一节&#xff1a;debug如何调试程序&#xff08;附带源代码&#xff09;-CSDN博客 Java第二节&#xff1a;debug如何调试栈帧链&#xff08;附带源代码&#xff09;-CSDN博客 Java第三节&#xff1a;新手如何用idea创建java项目-CSDN博客 步骤一 在需要修改…