前言
初出茅庐
Collection集合特点
Map集合特点
牛刀小试
List集合用法
迭代器原理
Set集合用法
Map集合用法
追根溯源
List集合解析
Set集合解析
Map集合解析
结束语
前言
Java中用来批量存储数据的方式有两种。一种是数组,而另一种就是较为高级的集合。数组在Java前段基础部分讲过很多,这里先回顾一下,数组有几个很明显的特点,1、严格规定数据单一存放类型。2、长度在创建时就固定不可更改(在不使用额外空间下)。3、其底层数据存放地址是连续的。集合其实和数组很像,但又不完全是,两者还是有区别的,通俗的理解就是集合是数组的Plus版本。
初出茅庐
当我们要去学一个未知的东西时,首先并不是如何使用它,而是先要了解它,知道它是什么,它的继承了什么,又实现了什么,它的大体结构是什么样的。那么我画了一张结构树,这里包含了我们Java基础所必须要了解并掌握的几个常用的集合类。
你也可以自己通过快捷键Ctrl+n进行类的查找,并且通过找到父类或实现类进行了解类的结构。
大体关系就如上图所说,一个Collection接口和一个Map接口包揽了几乎所有的常用集合,但是在这两个接口下又有不同的子类接口进行实现,更加准确的分类了不同功能和特性的集合实现类,譬如:Collection下就有List、Set和Queue这三个子接口,分别对应不同的功能的集合实现类,开发者更具需求进行逐个实现即可。
Collection接口特点
List接口旗下的集合里的元素是有序且可重复的,采用索引值进行存储和定位元素
Set接口旗下的集合里的元素是无序且不可重复的,采用hash码进行存储元素
Queue接口不常用,这里暂不做介绍
Map接口特点
map集合和Collection旗下的集合存储元素方式不同,map采用key-value,一键一值对应的方式来存储元素。key和value均为Object类型,灵活性较强
牛刀小试
List集合
先演示List接口下常用的ArrayList类的一些基本用法
//创建集合
ArrayList<String> list = new ArrayList<>();
//添加元素入集合
list.add("第一个元素");
list.add("第二个元素");
//获取元素
String s1 = list.get(0);
String s2 = list.get(1);
//遍历list集合内所有的元素
//第一种常规根据长度进行逐一遍历的方式
int size = list.size(); //获取list集合大小,就是元素个数
for (int i = 0; i <size; i++) { //使用索引逐一按顺序输出
String s = list.get(i);
System.out.println(s);
}
//第二种使用迭代器进行遍历输出
Iterator<String> iterator = list.iterator(); //获取一个迭代器对象
while (iterator.hasNext()){ //判断集合中当前位置下一个是否存在元素
String next = iterator.next(); //获取当前位置的下一个元素
System.out.println(next);
}
//删除元素
list.remove(0); //根据索引值删除元素
list.remove("第二个元素"); //根据元素值删除元素
System.out.println(list.size()); //验证是否删除成功
List集合的典型特征就是有序且可重复,所以可以通过索引来取值。遍历也有两种不同的方式,都可以达到相同的效果。一种通过集合的大小逐一遍历内部的元素。另一种通过创建对应的迭代器对象,逐一迭代元素。
迭代器原理
关于迭代器工作原理,由下图解释:
Set集合
下面演示Set集合的其中一个常用的HashSet实现类的一些基本的用法
//实例化一个Set接口旗下的HashSet实现类
HashSet<String> set = new HashSet<>();
//向HashSet里存放值
set.add("甲");
set.add("乙");
//由于Set是无序所以没有索引,只能用迭代器迭代出来
Iterator<String> iterator1 = set.iterator();
while (iterator1.hasNext()){
String next = iterator1.next();
System.out.println(next);
}
//移除值
set.remove("甲");
set.remove("乙");
System.out.println(set.size());
Set由于是无序的,所以就不会像List集合那样存在索引可以取值,只能使用迭代器进行取值,因为其是通过每存一个元素就计算其的哈希码算出存放位置,所以也证明了其内部的元素不可能重复,因为相同的值哈希码必然相同。
map集合
下面是map集合,通过map接口下的一个常用的HashMap实现类进行基本的用法进行演示说明。
//创建Map集合
Map<String,Integer> map = new HashMap<String,Integer>();
//添加元素到map集合中
map.put("第一个数",1);
map.put("第二个数",2);
//第一种方式
Set<String> set1 = map.keySet();
for (String s : set1){
System.out.println("key="+s+",value="+map.get(s));
}
//第二种
for (Map.Entry<String,Integer> entry: map.entrySet()) {
System.out.println("key="+entry.getKey()+",value="+entry.getValue());
}
//第三种
// 通过Map.entrySet使用iterator遍历key和value
Iterator<Map.Entry<String, Integer>> entries = map.entrySet().iterator();
while (entries.hasNext()) {
Map.Entry<String, Integer> entry = entries.next();
System.out.println(entry);
}
//移除元素
map.remove("第一个数");
map.remove("第二个数");
System.out.println(map.size());
map集合比前面的两种集合略微复杂一些,但是功能也会更加强大和高效。map存放元素是以键值对的形式进行存放,一个键对应一个值,键和值分别通过Set集合和List集合进行设计并存放。其迭代方式有三种,一种是通过先取key值,再通过key值,取出value值。第二种通过获取map内部的一个封闭接口拿到所有的key-value值的对象,再逐一获取对应的key和value值。第三种其实就是把foreach遍历换成了iterator迭代器遍历。原理和第二种类似。
追根溯源
集合的大概结构和基本的用法我们都已经清楚了,下面我们看看如此强大的集合对象究竟是怎么形成的。通过点开集合的源码我们就可以一目了然其内部构造了。
ArrayList解析
首先看它的底层初始构造,我们打开类的搜索项,搜索ArrayList类,
我们可以看到在创建ArrayList集合对象底层其实创建一个数组,也就是说集合底层就是个数组,如果但是集合和数组有什么区别呢?
一开始先创建一个默认容量为10的数组进行存储,如果存储的数据量超过10的话,就会进行扩容,扩容量为1.5倍(oldCapacity >> 1)。普通数组长度是固定,但是List集合对象长度是可以变化的。下面我们看他如何取出数据
当它get取这个索引所指向的值时,会先进行checkIndex方法进行判断该索引是否越界,越界就抛出越界异常,否则就通过数组取出该索引的值。
Set解析
Set常用接口的实现类HashSet的底层其实是一个Map集合,谈到了map集合下面就会介绍,可以先看map集合的解析,看完后再回来看这里就清楚了。Set结构与List是完全不同的
再观察他的存值特点
set存储数据时用到了hash方法计算哈希码的方式进行存储,这样set集合就不会出现重复的元素了,但是同样也带来没有索引值取数据困难的局面。
Map解析
这里主讲map集合的底层创建以及扩容机制。map是一个内部比较复杂集合,因为他的功能比较多结构精巧。他的底层实现用到了负载因子,根据计算阈值来创建,公式为阈值=负载因子*容量,这负载因子默认为0.75,
我们可以看到这个对象初始化只是把负载因子赋值了,我们下面再看它的添加元素方法
这里通过把key和value作为参数进行传到真正实现存储的putVal方法
我们可以看到这里创建了两个数组进行存储,并且下面两步将需要储存的传来的参数key和value进行存储到刚创建的数组中进行保存
我们可以看到在添加元素时,在没有创建实例时初始化后,put方法里会判断容量是否为空,调用resize方法第一次赋值容量赋值为16,阈值赋值为0.7516=12。每当超过阈值就会进行扩容,之后每次扩容都是两倍。总之容量和阈值之间保持0.75的比例
以上的是无参构造器实现及扩容机制,下面看有参构造器的实现:
有参构造器构造集合时,以上该种构造器就不会用默认的系统容量,则会使用开发者所定义的参数容量,但会使用系统默认的负载因子,下面会判断是否超过最大容量,超出则赋予系统默认最大支持的容量。并且在最后一行给阈值进行了赋值
注意:初始容量设置为2的倍数的话是自定义容量,如果不是则容量是系统根据以上算法算出离设定参数最近的2的n倍的容量。但是最后编译器仍会把我们设置的容量屏蔽,假设设置的初始容量为8,那么阈值就是80.75=6,此时扩容就会造成内存浪费,一般系统把容量定义为16。
结束语
以上就是Java集合篇的三大常用集合的归纳、常用功能和解析,除此之外还有很多其他特色功能的集合,以后也会根据需求撰写更多的相关内容。