一、XML概述
1.1简介
XML,全称为Extensible Markup Language,即可扩展标记语言,是一种用于存储和传输数据的文本格式。它是由W3C(万维网联盟)推荐的标准,广泛应用于各种系统中,如Web服务、数据库、移动应用等。与HTML相比,XML不是用于显示数据的,而是用于存储和传输数据,其语法结构更为严谨,可以支持自定义的标签和属性。
XML的语法规则很简单,由开始标签、结束标签、元素内容和属性组成。开始标签和结束标签使用尖括号括起来,元素内容位于开始标签和结束标签之间,属性则包含在开始标签中。XML文档的根元素是唯一的,所有其他元素都是其子元素。XML还可以使用DTD(文档类型定义)和XML Schema等方式定义文档的结构和内容约束。
由于XML的语法严谨、自定义标签和属性以及可扩展性等特点,使其成为一种流行的数据格式。它在Web服务中广泛应用,如SOAP协议、RESTful Web服务等,也用于配置文件、数据交换、文档传输等场景。
1.2用途
a.程序之间的数据传输通讯
PHP语言<- 快递100 <- Java 语言
b.配置文件config. xml
config. xm1 -> php语言、java语言、Python语言
c.存储数据,充当小型数据库
data. xml由于XML具有通用性、可扩展性和可读性等特点,因此被广泛用于描述和存储各种类型的数据,如文本、图片、音频、视频、配置文件等。XML还被广泛应用于Web服务、企业应用集成、电子商务、电子出版、数据交换等领域。
1.3什么是XML
XML被发明的目的是传输和存储数据,而不是展示数据;
XML的标签必须自定义,但是在写标签名的时候一定要有含义;
1.4为什么需要XML
1.5快速入门
1.6扩展技术
1.6.1DTD
1.6.2XSD
1.6.3XSL
二、XML的解析
2.1XML的解析方法
2.2Dom处理方法
其处理方式是将XML整个作为类似树结构的方式读入内存中以便操作及解析,方便修改。
解析大数据量的XML文件,会遇到内存泄露及程序崩溃的风险。
2.3 DOM类解析
2.4DOM读xml文件
package org.example;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;
public class Main {
public static void main(String[] a) {
recursiveTraverse(); //自上而下进行访问
System.out.println("========华丽丽的分割线=======");
traverseBySearch(); //根据名称进行搜索
}
public static void recursiveTraverse() {
try {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document document = db.parse(new File("D:\\workspace-java\\untitled4\\users.xml"));
NodeList usersList = document.getChildNodes();
for (int i = 0; i < usersList.getLength(); i++) {
Node users = usersList.item(i);
NodeList userList = users.getChildNodes();
for (int j = 0; j < userList.getLength(); j++) {
Node user = userList.item(j);
if (user.getNodeType() == Node.ELEMENT_NODE) {
NodeList metaList = user.getChildNodes();
for (int k = 0; k < metaList.getLength(); k++) {
Node meta = metaList.item(k);
if (meta.getNodeType() == Node.ELEMENT_NODE) {
System.out.println(meta.getNodeName()
+ ":" + meta.getTextContent());
}
}
System.out.println();
}
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
public static void traverseBySearch() {
try {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document document = db.parse(new File("D:\\workspace-java\\untitled4\\users.xml"));
org.w3c.dom.Element rootElement = document.getDocumentElement();
NodeList nodeList = rootElement.getElementsByTagName("name");
if (nodeList != null) {
for (int i = 0; i < nodeList.getLength(); i++) {
org.w3c.dom.Element element = (org.w3c.dom.Element) nodeList.item(i);
System.out.println(element.getNodeName() + " = " + element.getTextContent());
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
2.5DOM写xml文件
package org.example;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;
public class DomWriter {
public static void main(String[] args) {
try {
DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder dbBuilder = dbFactory.newDocumentBuilder();
// 新创建一个Document节点
Document document = dbBuilder.newDocument();
if (document != null) {
Element docx = document.createElement("document"); // 创建名为 "document" 的元素
Element element = document.createElement("element");
element.setAttribute("type", "paragraph");
element.setAttribute("alignment", "left"); // 为 element 增加属性
Element object = document.createElement("object");
object.setAttribute("type", "text");
Element text = document.createElement("text");
text.appendChild(document.createTextNode("abcdefg")); // 为 text 节点赋值
Element bold = document.createElement("bold");
bold.appendChild(document.createTextNode("true")); // 为 bold 节点赋值
object.appendChild(text); // 将 text 节点挂在 object 下
object.appendChild(bold); // 将 bold 节点挂在 object 下
element.appendChild(object); // 将 object 节点挂在 element 下
docx.appendChild(element); // 将 element 节点挂在 docx 下
document.appendChild(docx); // 将 docx 挂在 document 下
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
DOMSource source = new DOMSource(document);
// 定义目标文件
File file = new File("dom_result.xml");
StreamResult result = new StreamResult(file);
// 将 XML 内容写入文件中
transformer.transform(source, result);
System.out.println("Write XML file successfully");
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
2.6SAX处理方法
package org.example;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.helpers.XMLReaderFactory;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
public class SAXReader {
public static void main(String[] args) {
try {
XMLReader parser = XMLReaderFactory.createXMLReader();
BookHandler bookHandler = new BookHandler();
parser.setContentHandler(bookHandler);
parser.parse("books.xml");
System.out.println(bookHandler.getNameList());
} catch (SAXException | IOException e) {
e.printStackTrace();
}
}
}
class BookHandler extends DefaultHandler {
private List<String> nameList;
private boolean title = false;
public List<String> getNameList() {
return nameList;
}
// xml文档加载时
public void startDocument() {
System.out.println("Start parsing document...");
nameList = new ArrayList<>();
}
// 文档解析结束
public void endDocument() {
System.out.println("End");
}
// 访问某一个元素
public void startElement(String uri, String localName, String qName, Attributes atts) {
if (qName.equals("title")) {
title = true;
}
}
// 结束访问元素
public void endElement(String namespaceURI, String localName, String qName) {
if (title) {
title = false;
}
}
// 访问元素正文
public void characters(char[] ch, int start, int length) {
if (title) {
String bookTitle = new String(ch, start, length).trim();
if (!bookTitle.isEmpty()) {
System.out.println("Book title: " + bookTitle);
nameList.add(bookTitle);
}
}
}
}
2.7STAX处理方法
2.8其他第三方库