SAX解析XML返回对应格式的Map对象

news2025/1/7 6:04:39

前言

最近有一个解析大型xml的需求,xml大小7M,其中xml结构非常复杂,元素各种嵌套

不乏有元素下对象,元素下集合,集合下对象,集合下集合,兄弟节点,元素下对象下集合,同一元素下不同对象和集合...很复杂

注意:本方式无法解析递归元素 

 简介

本文使用了SAX解析XML,SAX对内存比较友好,但是对于编码比较复杂,但是本篇代码量不是很多,主要都集中在一个继承了DefaultHandler的处理类,该处理类中主要使用了两个方法,分别是startElement和endElement。

 阅读必读

比较难理解的是xml节点复杂关系的呈现,大概设计思路是定义三个map和一个int类型的下标值,三个map的作用是第1个map存储结果集第2个map记录元素下标对应的key第3map个记录下标key所属的元素对象。当startElement开始读取节点元素时将该元素的节点名称存储至第2个map并将该对象以该元素的节点名称存储至第三个map中,然后将int类型的下标值手动+1,最后当元素节点读取结束时开始组装格式,下面是代码呈现

 

package com.syasuo.xml;

import com.alibaba.fastjson.JSON;
import lombok.extern.slf4j.Slf4j;
import org.springframework.util.CollectionUtils;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import java.util.*;

/**
 * @author SYASUO
 * @date 2023/6/19 13:46
 */
@Slf4j
public class MyDefaultHandler extends DefaultHandler {
    
    //存储结果集
    private Map<String,Object> resultMap = new HashMap<>();
    
    //用下标标记key
    private Map<Integer,String> indexKeyMap = new HashMap<>();

    //下标标记的所属key的对象
    private Map<String,Map<String,Object>> indexKeyMapObj = new HashMap<>();
    
    //记录元素节点对应的下标,初始给0
    private int index = 0;
    
    @Override
    public void startDocument() throws SAXException {
        log.info("------------------------------XML读取开始------------------------------");
    }

    /**
     * 开始读取XML元素,每次记录下标对应的kay和该key对应的对象
     */
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        Map<String,Object> node = new HashMap<>();
        for (int i = 0; i < attributes.getLength(); i++) {
            node.put(attributes.getQName(i),attributes.getValue(i));
        }
        indexKeyMap.put(index,qName);
        indexKeyMapObj.put(qName,node);
        index++;
    }

    /**
     * 元素节点读取结束时,由于index在startElement中执行了+1操作,
     * 因此获取对应节点的父级节点时需要先执行index-1操作得到当前节点下标,在当前节点下标位再次执行-1操作得到父级节点
     * 取到父级节点时需要判断父级包不包含该节点,如果包含就说明该节点是一个List集合,否则就作为一个单独的对象放入父级对象中
     * 最后给resultMap结果集对象赋值即可
     */
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        Map<String,Object> curObj = indexKeyMapObj.get(qName);
        int j = --index;
        if(j > 0){
            j--;
            String qname = indexKeyMap.get(j);
            Map<String,Object> parent = indexKeyMapObj.get(qname);
            if(parent.containsKey(qName)){
                List<Map<String,Object>> list = new ArrayList<>();
                //System.out.println(parent.get(qName).getClass().getTypeName());
                if(parent.get(qName).getClass().getSimpleName().equals("HashMap")){
                    list.add((Map<String, Object>) parent.get(qName));
                }else{
                    list.addAll((Collection<? extends Map<String, Object>>) parent.get(qName));
                }
                //将当前节点对象加入当前对象集合
                list.add(curObj);
                parent.put(qName,list);
            }else{
                parent.put(qName,curObj);
            }
            resultMap = parent;
        }
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
      /*
        String element = new String(ch,start,length);
        log.info("该方法只有在【<ele>标签值</ele>】这种类型的标签下才能有效获取");
        */
    }

    /*
     * 结束文档时调用
     */
    @Override
    public void endDocument() throws SAXException {
        log.info("------------------------------XML读取结束------------------------------");
    }
    
    
    public Map<String,Object> getResultMap(){
        return resultMap;
    }
}

测试Main

注意:CprjInfo是xml对应格式的JavaBean,XML如何转JavaBean,可以看我这一篇

使用XJC将XML转换成JavaBean遇到的坑_辛丑年正月十五的博客-CSDN博客

package com.syasuo.xml;

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import com.syasuo.entity.CprjInfo;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
import java.io.IOException;
import java.util.Map;

/**
 * @author SYASUO
 * @date 2023/6/19 13:41
 */
public class Test {

    public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
        Long startTime = System.currentTimeMillis();
        SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
        MyDefaultHandler myDefaultHandler = new MyDefaultHandler();
        parser.parse(new File("D://root.xml"), myDefaultHandler);
        Map<String,Object> resultMap =  myDefaultHandler.getResultMap();
        //System.out.println(JSON.toJSONString(resultMap));
        CprjInfo cprjInfo = JSONObject.parseObject(JSON.toJSONString(resultMap),CprjInfo.class);
        System.out.println(JSON.toJSONString(cprjInfo));
        System.out.println(System.currentTimeMillis()-startTime);
    }
}

成功的截图,可以看见进度条多么小

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/663354.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数字时代,你想成为一只“弱鸡”,还是一个“超级个体”?

电话延伸了人类的耳朵&#xff0c;屏幕延伸了人类的眼睛&#xff0c;汽车这样的交通工具延伸了人类的腿脚&#xff0c;人类的生存能力开始变得和技术相关&#xff0c;而这个趋势仍在加剧。 如今&#xff0c;Web3延伸了人的综合体验&#xff0c;AI延伸了人类的大脑&#xff0c;它…

MySQL(视图、存储过程与函数、流程控制、触发器)

第一章 视图 1 什么是视图 为了提高复杂的SQL语句的复用性和表的操作的安全性 &#xff0c;MySQL数据库管理系统提高了视图特性&#xff0c;所谓视图&#xff0c;本质上是一种虚拟表&#xff0c;其内容与真实的表相似&#xff0c;包含一系列带有名称的列和行数据。但是视图并…

2023年前端面试汇总 - JavaScript

1. 数据类型 1.1. JavaScript有哪些数据类型&#xff0c;它们的区别&#xff1f; JavaScript共有八种数据类型&#xff0c;分别是 Undefined、Null、Boolean、Number、String、Object、Symbol、BigInt。 其中 Symbol 和 BigInt 是ES6 中新增的数据类型&#xff1a; Symbol …

避开这12个压测误区保证有效压测

压测本质上其实就是经验的问题&#xff0c;至于技术我认为现在都是配套了&#xff0c;也有人配套的东西也搞不清&#xff0c;那还是经验的问题。提醒下&#xff0c;这篇对野路子玩压测的人蛮有用的。 一、压测的误区 首先讲压测误区&#xff0c;每个误区我会简单的总结下&…

作为超级自动化的重要先驱,流程挖掘正在成为组织运营标配

正在成为组织运营标配的流程挖掘&#xff0c;到底有哪些商业价值&#xff1f; 作为超级自动化的重要先驱&#xff0c;流程挖掘正在成为组织运营标配 文/王吉伟 AIGC正在影响越来越多的行业&#xff0c;流程挖掘领域亦不例外。 Mindzie首先宣布集成生成式AI&#xff0c;使用户…

带你详细了解Redis事务锁机制-加实列演示-上

Redis_事务_锁机制_秒杀 Redis 的事务是什么? 1、Redis 事务是一个单独的隔离操作&#xff1a;事务中的所有命令都会序列化、按顺序地执行 2、事务在执行的过程中&#xff0c;不会被其他客户端发送来的命令请求所打断 3、Redis 事务的主要作用就是串联多个命令防止别的命令…

怎么学习和提升前端开发的能力? - 易智编译EaseEditing

要学习和提升前端开发的能力&#xff0c;您可以按照以下步骤进行&#xff1a; 掌握基础知识&#xff1a; 了解HTML、CSS和JavaScript的基本概念和语法。学习HTML用于创建网页结构&#xff0c;CSS用于样式设计和布局&#xff0c;JavaScript用于交互和动态效果。 学习框架和库&…

探讨太阳能热水器的安全隐患和雷电防护措施

太阳能热水器是指利用太阳光加热原理来获得热水的装置。随着科学技术的发展&#xff0c;太阳能热水器因其新颖、环保、节能且方便而深受消费者的喜爱&#xff0c;安装数量逐年增加。我国太阳能资源丰富&#xff0c;尤其是在广袤的西部中小城镇、农村地区&#xff0c;家家户户几…

NSSA实验和配置命令

1)拓扑 需求 2)需求&#xff1a;PC2和PC5互通 配置思路和配置命令 3&#xff09;配置思路&#xff1a; 第一步&#xff1a;先让R1能够和PC5互通&#xff0c;要先配置静态路由 [R1] ip route-static 192.168.4.0 24 192.168.18.8 第二步&#xff1a;在R8上写去往PC1/PC2的路…

定长图文验证码模型训练

文章目录 自定义数据集生成模型代码计算均值和标准差训练代码测试集成功率计算推理测试 市面上常见的验证码识别方案包括&#xff1a; 基于规则的方案&#xff1a;这种识别方案针对一些特定类型的验证码&#xff08;如数字、字母组合&#xff09;&#xff0c;利用编写规则的方式…

逛开发者集市啦,ShardingSphere 在亚马逊云科技中国峰会等你!

2023亚马逊云科技中国峰会将于6月27日-28日在上海世博中心盛大开幕。本次峰会以“共见价值成就”为主题&#xff0c;与合作伙伴展望云计算趋势及合作发展战略&#xff0c;分享行业解决方案&#xff0c;共同探讨协同销售策略和全新的 APN 计划&#xff0c;助力合作伙伴成就更多价…

计算机系统层次结构与操作系统和驱动的定义

一、程序分类 程序按其运行环境分为&#xff1a; 裸机程序&#xff1a;直接运行在对应硬件上的程序 应用程序&#xff1a;只能运行在对应操作系统上的程序 二、计算机系统的层次结构 计算机系统两种层次结构&#xff1a; 2.1 无操作系统的简单的两层结构 2.2 有操作系统的…

华为云物联网平台微信小程序开发教程2.0【完整详细教程】

一、简介 在之前曾发布过一篇文章“华为云物联网平台的微信小程序开发”&#xff0c;在最近接到部分用户私信在使用开发过程中出现的问题&#xff0c;例如API访问的"401"现象等问题&#xff0c;在重新查看上面的文章教程时发现教程内容的步骤不详细&#xff0c;现对教…

Postman快速入门(一)

一、基本介绍 postman是一款流程的接口调试工具&#xff0c;其特点就是使用简单&#xff0c;功能强大。使用角色也非常广泛&#xff0c;后端开发&#xff0c;前端人员&#xff0c;测试人员都可以使用它进行接口调试或测试。 下图是基本功能介绍 发送第一个请求 如果你是第一次…

人工智能如何彻底改变 SaaS 格局

人工智能 (AI) 正在颠覆几乎所有行业&#xff0c;并正在改变我们开展业务的方式。近年来&#xff0c;SaaS 行业一直是受影响最大的行业之一&#xff0c;人工智能在其指数级增长中发挥着至关重要的作用。在本文中&#xff0c;我们将详细讨论实施 AI 对 SaaS 产品的增长和开发有何…

C++拷贝构造函数

文章目录 拷贝构造函数是一个c的默认成员函数&#xff0c;它是用来拷贝对象的&#xff0c;当你想修改对象&#xff0c;但是又不想修改它本身&#xff0c;那么可以将其拷贝给一个对象对这个拷贝出来的对象进行操作 拷贝构造函数语法&#xff1a;类名&#xff08;const 类名&…

Java-API简析_java.util.StringTokenizer类(基于 Latest JDK)(浅析源码)

【版权声明】未经博主同意&#xff0c;谢绝转载&#xff01;&#xff08;请尊重原创&#xff0c;博主保留追究权&#xff09; https://blog.csdn.net/m0_69908381/article/details/131293596 出自【进步*于辰的博客】 其实我的【Java-API】专栏内的博文对大家来说意义是不大的。…

设计模式之——单例模式

✍&#x1f3fc;作者&#xff1a;周棋洛&#xff0c;计算机学生 ♉星座&#xff1a;金牛座 &#x1f3e0;主页&#xff1a;点击学习更多 &#x1f310;关键&#xff1a;JavaScript 单例 设计模式 单例模式的定义是&#xff1a;保证一个类仅有一个实例&#xff0c;并提供一个访问…

【操作系统】程序运行环境

目录 1.处理器运行模式 1.1特权指令 1.2非特权指令 2.中断和异常的概念 2.1中断和异常的定义 2.1.1外中断 2.1.2内中断&#xff08;异常&#xff09; 2.2中断和异常的处理过程 3.系统调用 1.处理器运行模式 计算机系统中&#xff0c;通常 CPU 执行两种不同性质的程序:一…

【Android开发基础】手机传感器信息的获取

文章目录 一、引言二、了解1、概述2、关键 三、设计1、UI设计&#xff08;1&#xff09;主界面&#xff08;2&#xff09;适配器item 2、编码&#xff08;1&#xff09;获取数据&#xff08;传感器信息&#xff09;&#xff08;2&#xff09;渲染数据&#xff08;初始化适配器&…