文章目录
- XML解析技术
- XML解析技术介绍
- Dom4j解析XML文件
- Dom4j解析各个节点
- Dom4j解析案例实战
XML解析技术
XML解析技术介绍
XML的数据作用是什么? 最终需要怎样处理?
作用: 存储数据、做配置信息、进行数据传输。
最终需要被程序进行读取,解析里面的信息。
XML解析就是使用程序读取XML中的数据:
有两种解析方式:
SAX解析
DOM解析(我们重点学习DOM解析)
DOM常见的解析工具:
名称 | 说明 |
---|---|
JAXP | SUN公司提供的一套XML的解析的API |
JDOM | JDOM是一个开源项目,它基于树型结构,利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作。 |
dom4j | 是JDOM的升级品,用来读写XML文件的。具有性能优异、功能强大和极其易使用的特点,它的性能超过sun公司官方的dom 技术,同时它也是一个开放源代码的软件,Hibernate也用它来读写配置文件。 |
jsoup | 功能强大DOM方式的XML解析开发包,尤其对HTML解析更加方便 |
DOM解析, 解析文档对象模型如下:
其中:
- Document对象: 代表整个xml文档对象
- Element对象: 代表元素(标签), 例如上面student, name, age等等
- Attribute对象: 代表属性, 例如上面的id
- Text对象: 代表文本内容, 例如上面张三, 李四等等
Element、Attribute、Text对象都是一个Node节点, 实现了Node接口
Dom4j解析XML文件
Dom4j下载及导入:
下载Dom4j框架,官网下载。
在项目中创建一个文件夹:lib
将dom4j-2.1.1.jar文件复制到 lib 文件夹
在jar文件上点右键,选择 Add as Library -> 点击OK
在类中导包使用
案例:
使用Dom4J把一个XML文件的数据进行解析
Dom4j解析XML-得到Document对象:
SAXReader类
构造器/方法 | 说明 |
---|---|
SAXReader() | 创建Dom4J的解析器对象 |
read(String url) | 加载XML文件成为Document对象 |
Document类
方法名 | 说明 |
---|---|
getRootElement() | 获得根元素对象 |
实现步骤:
步骤一: 准备一个XML文件
<?xml version="1.0" encoding="UTF-8"?>
<books>
<book id="0001" desc="我是第一本书">
<name> JavaWeb开发教程</name>
<author> 张孝祥 </author>
<sale>100.00元</sale>
</book>
<book id="0002">
<name>三国演义</name>
<author>罗贯中</author>
<sale>100.00元</sale>
</book>
<sql>
select * from user where age >= 18
</sql>
</books>
步骤二: 创建一个Domj解析器对象, 加载XML文件称为Document对象
步骤三: 获取根元素对象
public static void main(String[] args) throws Exception {
// 1. 创建一个Dom4j解析对象
SAXReader saxReader = new SAXReader();
// 把XML文件加载到内存中成为一个Document对象
// Document document = saxReader.read(new File("/Users/chenyq/Documents/learn_Java/code/JavaSE/xml-app/src/books.xml"));
InputStream is = Dom4jDemo.class.getResourceAsStream("/books.xml");
Document document = saxReader.read(is);
// 2. 获取根元素对象
Element root = document.getRootElement();
}
Dom4j解析各个节点
Dom4j解析XML的元素、属性、文本的方法如下:
方法名 | 说明 |
---|---|
List<Element> elements() | 得到当前元素下所有子元素 |
List<Element> elements(String name) | 得到当前元素下指定名字的子元素返回集合 |
Element element(String name) | 得到当前元素下指定名字的子元素,如果有很多名字相同的返回第一个 |
String getName() | 得到元素名字 |
String attributeValue(String name) | 通过属性名直接得到属性值 |
String elementText(子元素名) | 得到指定名称的子元素的文本 |
String getText() | 得到文本 |
演示代码:
public static void main(String[] args) throws Exception {
SAXReader saxReader = new SAXReader();
InputStream is = Dom4jDemo.class.getResourceAsStream("/books.xml");
Document document = saxReader.read(is);
Element root = document.getRootElement();
// 获取根元素下的所有子元素
List<Element> allsonEls = root.elements();
// 打印子元素的名称
for (Element allsonEl : allsonEls) {
System.out.println(allsonEl.getName()); // book book sql
}
// 获取当前元素下指定名字的子元素返回的集合
List<Element> bookEls = root.elements("book");
for (Element bookEl : bookEls) {
System.out.println(bookEl.getName()); // book book
}
// 得到当前元素下指定名字的子元素,如果有很多名字相同的返回第一个
Element bookEL = root.element("book");
System.out.println(bookEL.getName()); // book
// 通过属性名获取属性值
System.out.println(bookEL.attributeValue("id")); // 0001
// 得到指定名称的子元素的文本
System.out.println(bookEL.elementText("name")); // JavaWeb开发教程
// 得到文本
System.out.println(bookEL.element("sale").getText()); // 100.00元
}
Dom4j解析案例实战
需求:
利用Dom4J的知识,将Contact.xml文件中的联系人数据封装成List集合,其中每个元素是实体类Contact。打印输出 List 中的每个元素。
Contact.xml文件内容如下:
<?xml version="1.0" encoding="UTF-8"?>
<contactList>
<contact id="1">
<name>潘金莲</name>
<gender>女</gender>
<email>panpan@itcast.cn</email>
</contact>
<contact id="2">
<name>武松</name>
<gender>男</gender>
<email>wusong@itcast.cn</email>
</contact>
<contact id="3">
<name>武大狼</name>
<gender>男</gender>
<email>wuda@itcast.cn</email>
</contact>
<user>
</user>
</contactList>
要求打印结果如下图所示:
实现步骤如下:
步骤一: 创建一个Contact类
public class Contact {
private int id;
private String name;
private char gender;
private String email;
public Contact() {}
public Contact(int id, String name, char gender, String email) {
this.id = id;
this.name = name;
this.gender = gender;
this.email = email;
}
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public char getGender() {
return gender;
}
public void setGender(char gender) {
this.gender = gender;
}
public String getEmail() {
return email;
}
public void setEmail(String email) {
this.email = email;
}
@Override
public String toString() {
return "Contact{" +
"id=" + id +
", name='" + name + '\'' +
", gender=" + gender +
", email='" + email + '\'' +
'}';
}
}
步骤二: 在主类中进行下面操作
- 创建Dom4j解析器, 加载XML文件为Document对象
- 获取根元素对象
- 获取所有的contact元素
- 准备一个集合装contact对象, 遍历所有的contact元素, 获取类的成员变量的值添加到List集合中
public static void main(String[] args) throws Exception {
// 创建Dom4j解析器, 加载XML文件为Document对象
SAXReader saxReader = new SAXReader();
InputStream is = Dom4jDemo.class.getResourceAsStream("/Contacts.xml");
Document document = saxReader.read(is);
// 获取根元素对象
Element root = document.getRootElement();
// 获取所有的contact元素
List<Element> contactELs = root.elements("contact");
// 准备一个集合装contact对象
List<Contact> contacts = new ArrayList<>();
// 遍历contactELs
int id = 0;
for (Element contactEL : contactELs) {
Contact contact = new Contact();
contact.setId(Integer.valueOf(contactEL.attributeValue("id")));
contact.setName(contactEL.elementText("name"));
contact.setGender(contactEL.elementText("gender").charAt(0));
contact.setEmail(contactEL.elementText("email"));
// 加入到List集合
contacts.add(contact);
}
// 遍历集合
for (Contact contact : contacts) {
System.out.println(contact);
}
}
打印结果
Contact{id=1, name='潘金莲', gender=女, email='panpan@itcast.cn'}
Contact{id=2, name='武松', gender=男, email='wusong@itcast.cn'}
Contact{id=3, name='武大狼', gender=男, email='wuda@itcast.cn'}