17. XML

news2025/1/4 19:14:59

文章目录

  • 一、XML概念
  • 二、XML语法
    • 1、基础语法
    • 2、快速入门
    • 3、组成部分
    • 4、约束
      • 1. 约束概述
      • 2. 分类
      • 3. DTD
      • 4. Schema
  • 三、XML解析
    • 1、操作xml文档
    • 2、 解析xml的方式
      • 1. DOM
      • 2. SAX
      • 3. xml常见的解析器(工具包)
      • 4. Jsoup
        • (1)快速入门
        • (2)对象的使用
        • (3)快捷查询方式


一、XML概念

概念:Extensible Markup Language 可扩展标记语言

* 可扩展:标签都是自定义的。 <user>  <student>

* 功能
	* 存储数据
		1. 配置文件  properties配置文件只能配置一些简单的信息,对于复杂的配置信息一般使用xml来进行配置
			xml存储的信息具有结构化,能够比较好体现出数据与数据间的关系,而properties存储信息只有键值对形
			式,无法体现出数据间的关系
		2. 在网络中传输

* xml与html的区别
	1. xml标签都是自定义的,html标签是预定义。
	2. xml的语法严格,html语法松散
	3. xml是存储数据的,html是展示数据

* w3c:万维网联盟

二、XML语法

1、基础语法

1. xml文档的后缀名 .xml
2. xml第一行必须定义为文档声明(就算文档声明前面的行为空行也不行,文档声明必须在第一行)
3. xml文档中有且仅有一个根标签
4. 属性值必须使用引号(单双都可)引起来
5. 标签必须正确关闭(也就是说标签必须有始有闭,不存在自闭合标签)
6. xml标签名称区分大小写(如果标签的起始和闭合标签一个大写一个小写,那么就会报错)

2、快速入门

<?xml version='1.0' ?>
<users>
	<user id='1'>
		<name>zhangsan</name>
		<age>23</age>
		<gender>male</gender>
		<br/>
	</user>
	
	<user id='2'>
		<name>lisi</name>
		<age>24</age>
		<gender>female</gender>
	</user>
</users>

3、组成部分

1. 文档声明
	1. 格式:<?xml 属性列表 ?>   
	   注意: "<?xml" 和 "?>" 中符号和符号间不能乱加空格,如果乱加了空格会报错
	   如: < ?xml 属性列表 ?> 错误
	2. 属性列表:
		* version:版本号,一般可以写1.0,其为主流版本     版本号是必须的属性,不写版本号会报错
		* encoding:编码方式。告知解析引擎当前文档使用的字符集,默认值:ISO-8859-1
		* standalone:是否独立    现在一般情况下不进行设置
			* 取值:
				* yes:不依赖其他文件
				* no:依赖其他文件
2. 指令(了解):结合css的,导入css文件,并将xml文件的内容进行解析显示
	* <?xml-stylesheet type="text/css" href="a.css" ?>
	* 注意:此时xml不是用来存储数据了,而是用来展示数据,所以现在一般不这样用了
3. 标签:标签名称自定义的
	* 规则:
		* 名称可以包含字母、数字以及其他的字符 
		* 名称不能以数字或者标点符号开始 
		* 名称不能以字母 xml(或者 XML、Xml 等等)开始 
		* 名称不能包含空格 

4. 属性:
	id属性值唯一
	注意:引入约束后id值不唯一会报错,但是如果没有引入约束,那么id值不唯一不会报错
5. 文本:
   *  xml文件中如果出现特殊格式的字符需要进行转义,如
       if( a < b && a > c ){} 需要转义成  if ( a &lt; b &amp&amp; a &gt; c ){} 为了方便显示引入CDATA区
	* CDATA区:在该区域中的数据会被原样展示
		* 格式:  <![CDATA[ 数据 ]]>

代码

a.css

name{
    color:red;
}

a.xml

<?xml version="1.0" encoding="utf-8" standalone='no' ?>
<!--<?xml-stylesheet type="text/css" href="a.css" ?>-->

<users>

    <user id='1'>
        <name>张三</name>
        <age>23</age>
        <gender>male</gender>
        <br/>
    </user>

    <user id='2'>
        <name>lisi</name>
        <age>24</age>
        <gender>female</gender>

        <code>
               <!-- if(a &lt; b &amp;&amp; a &gt; c){}-->
            <![CDATA[
                if(a < b && a > c) {}
            ]]]>


        </code>

    </user>

</users>

4、约束

1. 约束概述

* 约束:规定xml文档的书写规则
* 作为框架的使用者(程序员):
	1. 能够在xml中引入约束文档
	2. 能够简单的读懂约束文档

在这里插入图片描述

2. 分类

1. DTD:一种简单的约束技术 ,后缀名: .dtd
2. Schema:一种复杂的约束技术,后缀名: .xsd

3. DTD

一个简单的DTD约束文档

<!ELEMENT students (student+) >
<!ELEMENT student (name,age,sex)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!ATTLIST student number ID #REQUIRED>

阅读DTD约束文档

1. 通过 ELEMENT 来定义标签
	<!ELEMENT students (student+) >  
	定义students标签,这个标签里面可以放student标签作为其子标签,这个标签至少出现1次
		可以通过量词来描述子标签在父标签内的出现次数
			+ : 出现至少1次
			* : 可以出现任意次数
			不加符号:必须且只能出现 1 次
			
	<!ELEMENT student (name,age,sex)>  
	定义student标签,这个标签里面可以放name,age,sex子标签,这些子标签只能出现1次,并且得按name,age,sex的顺序出现

	<!ELEMENT name (#PCDATA)>
	定义name标签,这个标签里面可以放字符串

	<!ELEMENT age (#PCDATA)>
	定义age 标签,这个标签里面可以放字符串
	
	<!ELEMENT sex (#PCDATA)>
	定义sex 标签,这个标签里面可以放字符串
	
2. 通过ATTLIST 来定义属性
	<!ATTLIST student number ID #REQUIRED>
	定义student 标签的属性number
		number:属性名称  
		ID:number属性值必须唯一   
		#REQUIRED : number属性必须出现

引入DTD文档到xml文档中

* 内部dtd:将约束规则定义在xml文档中
	* <!DOCTYPE students [ dtd约束文档内容 ]>
* 外部dtd:将约束的规则定义在外部的dtd文件中
	* 本地:<!DOCTYPE 根标签名 SYSTEM "dtd文件的位置">    SYSTEM 表示系统本地的意思
	* 网络:<!DOCTYPE 根标签名 PUBLIC "dtd文件名字" "dtd文件的位置URL">   PUBLIC 表示网络开放的

根据DTD约束文档书写xml文档

<?xml version="1.0" encoding="UTF-8" ?>
<!--外部dtd-->
<!DOCTYPE students SYSTEM "student.dtd">

<!--内部dtd-->
<!--
<!DOCTYPE students [

		<!ELEMENT students (student+) >
		<!ELEMENT student (name,age,sex)>
		<!ELEMENT name (#PCDATA)>
		<!ELEMENT age (#PCDATA)>
		<!ELEMENT sex (#PCDATA)>
		<!ATTLIST student number ID #REQUIRED>


		]>
-->
<students>
	
	<student number="s001">
		<name>zhangsan</name>
		<age>abc</age>
		<sex>hehe</sex>
	</student>

	<student number="s002">
		<name>lisi</name>
		<age>24</age>
		<sex>female</sex>
	</student>
	
</students>

DTD约束文档缺点

DTD约束文档只能定义标签及其结构,如果一个标签所包裹的内容是文本,那么DTD约束文档就无法对其内容进行约束

4. Schema

一个简单的Schema约束文档

<?xml version="1.0"?>
<xsd:schema xmlns="http://www.itcast.cn/xml"
        xmlns:xsd="http://www.w3.org/2001/XMLSchema"
        targetNamespace="http://www.itcast.cn/xml" elementFormDefault="qualified">
    <xsd:element name="students" type="studentsType"/>
    <xsd:complexType name="studentsType">
        <xsd:sequence>
            <xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
        </xsd:sequence>
    </xsd:complexType>
    <xsd:complexType name="studentType">
        <xsd:sequence>
            <xsd:element name="name" type="xsd:string"/>
            <xsd:element name="age" type="ageType" />
            <xsd:element name="sex" type="sexType" />
        </xsd:sequence>
        <xsd:attribute name="number" type="numberType" use="required"/>
    </xsd:complexType>
    <xsd:simpleType name="sexType">
        <xsd:restriction base="xsd:string">
            <xsd:enumeration value="male"/>
            <xsd:enumeration value="female"/>
        </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType name="ageType">
        <xsd:restriction base="xsd:integer">
            <xsd:minInclusive value="0"/>
            <xsd:maxInclusive value="256"/>
        </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType name="numberType">
        <xsd:restriction base="xsd:string">
            <xsd:pattern value="heima_\d{4}"/>
        </xsd:restriction>
    </xsd:simpleType>
</xsd:schema> 

阅读Schema约束文档

Schema约束文档本身就是一个xml文档
1. 通过element定义标签
	属性
		* name:定义标签的名称
		* type:定义标签的类型
			*自带的类型,如:type="xsd:string"
			*自定义类型: 自定义类型必须进行定义
		* minOccurs :定义标签最少出现的次数
		* maxOccurs:定义标签最多出现的次数
			* unbounded:表示没有限制
2. 通过complexType定义复合的标签类型
	属性
		* name:标签类型名称
	子标签
		* sequence:定义在里面的标签元素必须按顺序出现
		* attribute :定义标签的属性
			属性
				* name:属性名称
				* type:属性类型
				* use : 定义是否必须的属性,required 表示必须的
	注意点
		* 复合的标签类型里面还可以定义其他的标签,所以复合类型定义的是标签
3. 通过simpleType定义简单的标签类型
	属性
		* name : 标签名称
	子标签
		* restriction: 定义基本的类型,并对类型进行限制
			属性
				* base :定义基本的类型
				  如:
					  base="xsd:integer":定义的是整数类型
					  base="xsd:string" :定义的是字符串类型
			子标签
				* minInclusive:限定内容的最小值
				* maxInclusive:限定内容的最大值
				* enumeration:枚举限定,只能是枚举里面的内容,在枚举内容里面取其一
				* pattern:定义正则表达式来对内容进行限定
	注意点
		* 简单的标签类型里面不能定义其他的标签,所以简单的标签类型定义的是文本内容			

引入Schema文档到xml文档中

1.填写xml文档的根元素
2.引入xsi前缀.  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"    
3.引入Schema文件命名空间.  xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd"
	* student.xsd : Schema文档的路径
	* "http://www.itcast.cn/xml:给 Schema文档取的名字(名称空间或命名空间)
4.为每一个Schema约束声明一个前缀,作为标识  xmlns="http://www.itcast.cn/xml" 
	* 在没有引入前缀时,每一个标签的使用必须要加上Schema文件的命名空间
		如:
			<http://www.itcast.cn/xml:student number="heima_0001"> </student>
	* 引入前缀后,可以通过前缀定义的字符来代替命名空间
		如:
		xmlns:a="http://www.itcast.cn/xml" ,用a来代替命名空间http://www.itcast.cn/xml
		<a:student number="heima_0001"> </student>
	* 当只引入一个Schema文档时,可以将前缀字符设置成空
		如:
		xmlns="http://www.itcast.cn/xml",用空来代替名称空间http://www.itcast.cn/xml
		<student number="heima_0001"> </student>
		
	* 注意如果引入多个Schema文档且文档内存在相同名称的标签元素,
	  那么必须给它们取上不同的前缀名,以示区分。此时最多只能有一个
	  前缀设置成空,其他前缀必须不为空且前缀名称不相同。
		如:
		<students   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
			xmlns="http://www.itcast.cn/xml"
			xmlns:a="http://www.itcast.cn/xml1"
			xsi:schemaLocation="
			http://www.itcast.cn/xml  student.xsd
			http://www.itcast.cn/xml1  student1.xsd"  
		>

示例
<students   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	xmlns="http://www.itcast.cn/xml"
	xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd">

根据Schema约束文档书写xml文档

<?xml version="1.0" encoding="UTF-8" ?>
<!-- 
	1.填写xml文档的根元素
	2.引入xsi前缀.  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	3.引入xsd文件命名空间.  xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd"
	4.为每一个xsd约束声明一个前缀,作为标识  xmlns="http://www.itcast.cn/xml" 
	
	
 -->
<students   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
			xmlns="http://www.itcast.cn/xml"
			xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd"
>
	<student number="heima_0001">
		<name>tom</name>
		<age>18</age>
		<sex>male</sex>
	</student>

</students>

三、XML解析

1、操作xml文档

1. 解析(读取):将文档中的数据读取到内存中
2. 写入:将内存中的数据保存到xml文档中。持久化的存储

2、 解析xml的方式

1. DOM

DOM:将标记语言文档一次性加载进内存,在内存中形成一颗dom树,一般用在服务端
	* 优点:操作方便,可以对文档进行CRUD的所有操作
	* 缺点:占内存

在这里插入图片描述

2. SAX

SAX:逐行读取,基于事件驱动的。由标签事件驱动,然后进行处理。一般用在移动端
	* 优点:不占内存。读一行释放一行
	* 缺点:只能读取,不能增删改

3. xml常见的解析器(工具包)

1. JAXP:sun公司提供的解析器,支持dom和sax两种思想      很少使用
2. DOM4J:一款非常优秀的解析器
3. Jsoup:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。
	它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
4. PULL:Android操作系统内置的解析器,sax方式的。

4. Jsoup

(1)快速入门

步骤

1. 导入jar包
	jsoup-1.11.2.jar
2. 获取Document对象
3. 获取对应的标签Element对象
4. 获取数据

代码
要进行操作的xml文档:student.xml

<?xml version="1.0" encoding="UTF-8" ?>

<students>
	<student number="heima_0001">
		<name id="itcast">
			<xing></xing>
			<ming></ming>
		</name>
		<age>18</age>
		<sex>male</sex>
	</student>
	<student number="heima_0002">
		<name>jack</name>
		<age>18</age>
		<sex>female</sex>
	</student>

</students>

操作代码

package cn.itcast.xml.jsoup;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.IOException;

/**
 * Jsoup快速入门
 */
public class JsoupDemo1 {
    public static void main(String[] args) throws IOException {
        //2.获取Document对象,根据xml文档获取
        //2.1获取student.xml的path
        String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
        //2.2解析xml文档,加载文档进内存,获取dom树--->Document  注意这里的字符集要和xml文档的字符集一致
        Document document = Jsoup.parse(new File(path), "utf-8");
        //3.获取元素对象 Element
        Elements elements = document.getElementsByTag("name");

        System.out.println(elements.size());
        //3.1获取第一个name的Element对象
        Element element = elements.get(0);
        //3.2获取数据
        String name = element.text();
        System.out.println(name);
    }

}

(2)对象的使用

1) Jsoup:工具类,可以解析html或xml文档,返回Document

* parse:解析html或xml文档,返回Document
	* parse​(File in, String charsetName):解析xml或html文件的。
	* parse​(String html):解析xml或html字符串
	* parse​(URL url, int timeoutMillis):通过网络路径获取指定的html或xml的文档对象,这种方式爬虫里面用的比较多
	  URL:统一资源定位符

代码

package cn.itcast.xml.jsoup;


import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.IOException;
import java.net.URL;

/**
 * Jsoup对象功能
 */
public class JsoupDemo2 {
    public static void main(String[] args) throws IOException {
        //2.1获取student.xml的path
        String path = JsoupDemo2.class.getClassLoader().getResource("student.xml").getPath();
        //2.2解析xml文档,加载文档进内存,获取dom树--->Document
       /* Document document = Jsoup.parse(new File(path), "utf-8");
        System.out.println(document);*/

       //2.parse​(String html):解析xml或html字符串
       /* String str = "<?xml version=\"1.0\" encoding=\"UTF-8\" ?>\n" +
                "\n" +
                "<students>\n" +
                "\t<student number=\"heima_0001\">\n" +
                "\t\t<name>tom</name>\n" +
                "\t\t<age>18</age>\n" +
                "\t\t<sex>male</sex>\n" +
                "\t</student>\n" +
                "\t<student number=\"heima_0002\">\n" +
                "\t\t<name>jack</name>\n" +
                "\t\t<age>18</age>\n" +
                "\t\t<sex>female</sex>\n" +
                "\t</student>\n" +
                "\n" +
                "</students>";
        Document document = Jsoup.parse(str);
        System.out.println(document);*/

       //3.parse​(URL url, int timeoutMillis):通过网络路径获取指定的html或xml的文档对象
        URL url = new URL("https://baike.baidu.com/item/jsoup/9012509?fr=aladdin");//代表网络中的一个资源路径
        Document document = Jsoup.parse(url, 10000);
        System.out.println(document);

    }

}

2)Document:文档对象。代表内存中的dom树

* 获取Element对象
	* getElementById​(String id):根据id属性值获取唯一的element对象
	* getElementsByTag​(String tagName):根据标签名称获取元素对象集合
	* getElementsByAttribute​(String key):根据属性名称获取元素对象集合
	* getElementsByAttributeValue​(String key, String value):根据对应的属性名和属性值获取元素对象集合

代码

package cn.itcast.xml.jsoup;


import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.IOException;
import java.net.URL;

/**
 * Document/Element对象功能
 */
public class JsoupDemo3 {
    public static void main(String[] args) throws IOException {
        //1.获取student.xml的path
        String path = JsoupDemo3.class.getClassLoader().getResource("student.xml").getPath();
        //2.获取Document对象
        Document document = Jsoup.parse(new File(path), "utf-8");

        //3.获取元素对象了。
        //3.1获取所有student对象
        Elements elements = document.getElementsByTag("student");
        System.out.println(elements);

        System.out.println("-----------");


        //3.2 获取属性名为id的元素对象们
        Elements elements1 = document.getElementsByAttribute("id");
        System.out.println(elements1);
        System.out.println("-----------");
        //3.2获取 number属性值为heima_0001的元素对象
        Elements elements2 = document.getElementsByAttributeValue("number", "heima_0001");
        System.out.println(elements2);

        System.out.println("-----------");
        //3.3获取id属性值的元素对象
        Element itcast = document.getElementById("itcast");
        System.out.println(itcast);
    }

}

3)Elements:元素Element对象的集合。可以当做 ArrayList来使用
4)Element:元素对象

1. 获取子元素对象
	* getElementById​(String id):根据id属性值获取唯一的element对象
	* getElementsByTag​(String tagName):根据标签名称获取元素对象集合
	* getElementsByAttribute​(String key):根据属性名称获取元素对象集合
	* getElementsByAttributeValue​(String key, String value):根据对应的属性名和属性值获取元素对象集合

2. 获取属性值
	* String attr(String key):根据属性名称获取属性值
3. 获取文本内容
	* String text():获取所有子标签的纯文本内容(不包括子标签的标签内容,只包括标签内的文本内容)
	* String html():获取标签体的所有内容(包括子标签的标签和文本内容)

代码

package cn.itcast.xml.jsoup;


import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.IOException;

/**
 *Element对象功能
 */
public class JsoupDemo4 {
    public static void main(String[] args) throws IOException {
        //1.获取student.xml的path
        String path = JsoupDemo4.class.getClassLoader().getResource("student.xml").getPath();
        //2.获取Document对象
        Document document = Jsoup.parse(new File(path), "utf-8");
        /*
        Element:元素对象
				1. 获取子元素对象
					* getElementById​(String id):根据id属性值获取唯一的element对象
					* getElementsByTag​(String tagName):根据标签名称获取元素对象集合
					* getElementsByAttribute​(String key):根据属性名称获取元素对象集合
					* getElementsByAttributeValue​(String key, String value):根据对应的属性名和属性值获取元素对象集合

				2. 获取属性值
					* String attr(String key):根据属性名称获取属性值
				3. 获取文本内容
					* String text():获取所有字标签的纯文本内容
					* String html():获取标签体的所有内容(包括子标签的标签和文本内容)
         */
        //通过Document对象获取name标签,获取所有的name标签,可以获取到两个
        Elements elements = document.getElementsByTag("name");
        System.out.println(elements.size());
        System.out.println("----------------");
        //通过Element对象获取子标签对象
        Element element_student = document.getElementsByTag("student").get(0);
        Elements ele_name = element_student.getElementsByTag("name");
        System.out.println(ele_name.size());

        //获取student对象的属性值
        String number = element_student.attr("NUMBER");
        System.out.println(number);
        System.out.println("------------");
        //获取文本内容
        String text = ele_name.text();
        String html = ele_name.html();
        System.out.println(text);
        System.out.println(html);
    }

}

5 ) Node:节点对象, 是Document和Element的父类

(3)快捷查询方式

1)selector:选择器

* 使用的方法:Elements	select​(String cssQuery) 
    * 结合css选择器一起使用(cssQuery就是css选择器)
	* 语法:参考Selector类中定义的语法

代码

package cn.itcast.xml.jsoup;


import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.IOException;

/**
 *选择器查询
 */
public class JsoupDemo5 {
    public static void main(String[] args) throws IOException {
        //1.获取student.xml的path
        String path = JsoupDemo5.class.getClassLoader().getResource("student.xml").getPath();
        //2.获取Document对象
        Document document = Jsoup.parse(new File(path), "utf-8");

        //3.查询name标签
        /*
            div{

            }
         */
        Elements elements = document.select("name");
        System.out.println(elements);
        System.out.println("=----------------");
        //4.查询id值为itcast的元素
        Elements elements1 = document.select("#itcast");
        System.out.println(elements1);
        System.out.println("----------------");
        //5.获取student标签并且number属性值为heima_0001的age子标签
        //5.1.获取student标签并且number属性值为heima_0001
        Elements elements2 = document.select("student[number=\"heima_0001\"]");
        System.out.println(elements2);
        System.out.println("----------------");

        //5.2获取student标签并且number属性值为heima_0001的age子标签
        Elements elements3 = document.select("student[number=\"heima_0001\"] > age");
        System.out.println(elements3);

    }

}

2)XPath:XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言

* 使用Jsoup的Xpath需要额外导入jar包。
	* JsoupXpath-0.3.2.jar 
* 查询w3cshool参考手册,使用xpath的语法完成查询
	* https://www.w3school.com.cn/xpath/index.asp

代码

package cn.itcast.xml.jsoup;


import cn.wanghaomiao.xpath.exception.XpathSyntaxErrorException;
import cn.wanghaomiao.xpath.model.JXDocument;
import cn.wanghaomiao.xpath.model.JXNode;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.IOException;
import java.util.List;

/**
 *XPath查询
 */
public class JsoupDemo6 {
    public static void main(String[] args) throws IOException, XpathSyntaxErrorException {
        //1.获取student.xml的path
        String path = JsoupDemo6.class.getClassLoader().getResource("student.xml").getPath();
        //2.获取Document对象
        Document document = Jsoup.parse(new File(path), "utf-8");

        //3.根据document对象,创建JXDocument对象
        JXDocument jxDocument = new JXDocument(document);

        //4.结合xpath语法查询
        //4.1查询所有student标签
        List<JXNode> jxNodes = jxDocument.selN("//student");
        for (JXNode jxNode : jxNodes) {
            System.out.println(jxNode);
        }

        System.out.println("--------------------");

        //4.2查询所有student标签下的name标签
        List<JXNode> jxNodes2 = jxDocument.selN("//student/name");
        for (JXNode jxNode : jxNodes2) {
            System.out.println(jxNode);
        }

        System.out.println("--------------------");

        //4.3查询student标签下带有id属性的name标签
        List<JXNode> jxNodes3 = jxDocument.selN("//student/name[@id]");
        for (JXNode jxNode : jxNodes3) {
            System.out.println(jxNode);
        }
        System.out.println("--------------------");
        //4.4查询student标签下带有id属性的name标签 并且id属性值为itcast

        List<JXNode> jxNodes4 = jxDocument.selN("//student/name[@id='itcast']");
        for (JXNode jxNode : jxNodes4) {
            System.out.println(jxNode);
        }
    }

}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/146658.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VUE3 学习笔记(一):环境配置、项目创建

一、首先需要安装node.jsnodejs官网&#xff1a;Node.js (nodejs.org)下载安装包&#xff1a;下载稳定版本即可&#xff0c;目前&#xff08;2023-01-07&#xff09;是18.13.0版本c. 检查当前版本&#xff08;CMD&#xff09;&#xff1a;至此&#xff0c;nodejs已经安装成功&a…

电力系统机组组合(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️❤️&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清…

EM算法学习总结

序 这个和我的硕士毕业论文的题目就有一定关系&#xff0c;我的导师让我按时向她汇报学习进度。然而我还在进行实习&#xff0c;还要准备自己明年的秋招&#xff0c;只能想办法游走于三者之间。 EM算法是一个常用的数据挖掘算法&#xff0c;想必从事数据挖掘的相关工作的同学…

机器人操作系统ROS/ROS2(1)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录前言一、ROS和ROS2是什么&#xff1f;二、ROS2安装步骤1.Ubuntu虚拟机安装2.ROS2系统安装3.验证ROS2安装成功4.小海龟仿真示例总结前言 提示&#xff1a;这里可以添…

LeetCode刷题模版:21 - 30

目录 简介21. 合并两个有序链表22. 括号生成23. 合并K个升序链表24. 两两交换链表中的节点25. K 个一组翻转链表26. 删除有序数组中的重复项27. 移除元素28. 找出字符串中第一个匹配项的下标29. 两数相除【未理解】30. 串联所有单词的子串【未理解】结语简介 Hello! 非常感谢您…

devops 是什么东东了

DevOps&#xff0c;字面意思是Development &Operations的缩写。 DevOps是从实践中逐步总结提炼出的方法论理念。近而创造了DevOps这个词。 DevOps概念的萌芽阶段&#xff1a; 2008年敏捷大会上&#xff0c;来自Patrick Debois发表了题为 《Agile Infrastructure & Op…

基于.NET技术的动漫管理系统,给各位二次元老司机提供的动漫管理平台,基于.NET的前后端框架Blazor,含安装教程及使用说明

介绍 老司机驾驶舱——给各位二次元老司机提供的动漫管理平台。 下载地址&#xff1a;基于.NET技术的动漫管理系统 编写本应用的目的主要是实践巨硬&#xff08;Microsoft&#xff09;的新一代前端框架Blazor与EntityFramework&#xff0c;本应用也给想要学习这套框架的童鞋提…

Ubuntu20.04 hyperledger fabric2.4基于Docker搭建blockchain-explorer

准备 启动fabric测试网络。   这里默认已经完成了Fabric测试网络搭建以及运行。   后续会出Fabric安装&#xff0c;现在不会的就先去看别的博客 配置 1.在test-network 文件夹下面建立explorer文件夹&#xff1a; mkdir explorer2. 配置文件 2.1下载配置文件 先进文件…

Isaac Sim 机器人仿真器介绍、安装与 Docker [1]

前言与参考 此文书写于&#xff1a; January 6, 2023&#xff0c; 更新于 January 6, 2023 &#xff1b;可能会随着时间的变化 此教程会有过时概念哦 Isaac Sim 相关参考链接&#xff1a; 官方文档地址官方docker image 镜像地址官方讨论 论坛链接&#xff0c;建议没啥事就可…

【JavaGuide面试总结】Java基础篇·中

【JavaGuide面试总结】Java基础篇中1.重载和重写有什么区别&#xff1f;2.什么是可变长参数&#xff1f;3.为什么浮点数运算的时候会有精度丢失的风险&#xff1f;4.如何解决浮点数运算的精度丢失问题&#xff1f;5.超过 long 整型的数据应该如何表示&#xff1f;6.基本类型和包…

JSP——标准标签库 (JSTL)

✅作者简介&#xff1a;热爱国学的Java后端开发者&#xff0c;修心和技术同步精进。 &#x1f34e;个人主页&#xff1a;Java Fans的博客 &#x1f34a;个人信条&#xff1a;不迁怒&#xff0c;不贰过。小知识&#xff0c;大智慧。 &#x1f49e;当前专栏&#xff1a;JAVA开发者…

5G NR标准: 第19章 毫米波射频技术

第19章 毫米波射频技术 现有的 2G、3G 和 4G 移动通信 3GPP 规范适用于 6 GHz 以下的频率范围&#xff0c;相应的 RF 要求考虑了与 6 GHz 以下操作相关的技术方面。 NR 也在这些频率范围内运行&#xff08;标识为频率范围 1&#xff09;&#xff0c;但另外还将定义为在 24.25…

【人工智能原理自学】梯度下降和反向传播:能改

&#x1f60a;你好&#xff0c;我是小航&#xff0c;一个正在变秃、变强的文艺倾年。 &#x1f514;笔记来自B站UP主Ele实验室的《小白也能听懂的人工智能原理》。 &#x1f514;本文讲解梯度下降和反向传播&#xff1a;能改&#xff0c;一起卷起来叭&#xff01; 目录一、“挪…

Rollup Decentralization

1. 引言 当前的Rollup为中心化的&#xff0c;这并不是必须的&#xff0c;而是当前的选择。 2. 何为Rollup&#xff1f; Rollup与其它L2或侧链的主要区别在于&#xff1a; L1数据可用性 Rollup&#xff1a;只要L1的数据可用性存在&#xff0c;用户可重构L2状态&#xff0c;然…

SQL LIKE 操作符

LIKE 操作符用于在 WHERE 子句中搜索列中的指定模式。 SQL LIKE 操作符 LIKE 操作符用于在 WHERE 子句中搜索列中的指定模式。 SQL LIKE 语法 SELECT column1, column2, ... FROM table_name WHERE column LIKE pattern; 参数说明&#xff1a; column1, column2, ...&…

php://filter伪协议(总结)

文章目录php://filter伪协议总结php://filter伪协议介绍php://filter伪协议使用方法php://filter过滤器分类filter字符串过滤器string.rot13string.toupperstring.tolowerstring.strip_tagsfilter转换过滤器convert.base64-encodeconvert.base64-decodeconvert.quoted-printabl…

【Kotlin】空安全 ① ( Kotlin 的空安全机制 | 变量可空性 | 默认变量不可赋空值 | 声明可空类型变量 )

文章目录一、Kotlin 的空安全机制二、变量可空性1、默认变量不可赋空值2、声明可空类型变量一、Kotlin 的空安全机制 Java 中的空指针问题 : 在 Java 语言 编写的程序中 , 出现最多的崩溃就是 NullPointerException 空指针异常 , 该异常是 运行时 才爆出的 , 在 代码编写时 以…

冰冰学习笔记:C++11的新特性

欢迎各位大佬光临本文章&#xff01;&#xff01;&#xff01; 还请各位大佬提出宝贵的意见&#xff0c;如发现文章错误请联系冰冰&#xff0c;冰冰一定会虚心接受&#xff0c;及时改正。 本系列文章为冰冰学习编程的学习笔记&#xff0c;如果对您也有帮助&#xff0c;还请各位…

k8s入门教程

文章导读 kubernetes&#xff0c;是一个全新的基于容器技术的分布式架构领先方案&#xff0c;是谷歌严格保密十几年的秘密武器----Borg系统的一个开源版本&#xff0c;于2014年9月发布第一个版本&#xff0c;2015年7月发布第一个正式版本。 kubernetes的本质是一组服务器集群&…

创建自己的docker镜像

dockerfile案例1导入dockerfiel以及java文件导入后第一步docker build -t javaweb:1.0 .docker build -t &#xff08;名称以及对应的版本&#xff09;javaweb:1.0 .&#xff08;空格之后的一个点表示从当前目录开始&#xff09;导入成功之后运行容器即可docker run --name web…