Java入门到入土（集合篇）

前言
   初出茅庐
      Collection集合特点
      Map集合特点
   牛刀小试
      List集合用法
         迭代器原理
      Set集合用法
      Map集合用法
   追根溯源
      List集合解析
      Set集合解析
      Map集合解析
结束语

前言

Java中用来批量存储数据的方式有两种。一种是数组，而另一种就是较为高级的集合。数组在Java前段基础部分讲过很多，这里先回顾一下，数组有几个很明显的特点，1、严格规定数据单一存放类型。2、长度在创建时就固定不可更改(在不使用额外空间下)。3、其底层数据存放地址是连续的。集合其实和数组很像，但又不完全是，两者还是有区别的，通俗的理解就是集合是数组的Plus版本。

初出茅庐

当我们要去学一个未知的东西时，首先并不是如何使用它，而是先要了解它，知道它是什么，它的继承了什么，又实现了什么，它的大体结构是什么样的。那么我画了一张结构树，这里包含了我们Java基础所必须要了解并掌握的几个常用的集合类。
在这里插入图片描述
你也可以自己通过快捷键Ctrl+n进行类的查找，并且通过找到父类或实现类进行了解类的结构。

大体关系就如上图所说，一个Collection接口和一个Map接口包揽了几乎所有的常用集合，但是在这两个接口下又有不同的子类接口进行实现，更加准确的分类了不同功能和特性的集合实现类，譬如：Collection下就有List、Set和Queue这三个子接口，分别对应不同的功能的集合实现类，开发者更具需求进行逐个实现即可。

Collection接口特点

List接口旗下的集合里的元素是有序且可重复的，采用索引值进行存储和定位元素
Set接口旗下的集合里的元素是无序且不可重复的，采用hash码进行存储元素
Queue接口不常用，这里暂不做介绍

Map接口特点

map集合和Collection旗下的集合存储元素方式不同，map采用key-value，一键一值对应的方式来存储元素。key和value均为Object类型，灵活性较强

牛刀小试

List集合

先演示List接口下常用的ArrayList类的一些基本用法

//创建集合
        ArrayList<String> list = new ArrayList<>();

        //添加元素入集合
        list.add("第一个元素");
        list.add("第二个元素");

        //获取元素
        String s1 = list.get(0);
        String s2 = list.get(1);

        //遍历list集合内所有的元素
        //第一种常规根据长度进行逐一遍历的方式
        int size = list.size(); //获取list集合大小，就是元素个数
        for (int i = 0; i <size; i++) {     //使用索引逐一按顺序输出
            String s = list.get(i);
            System.out.println(s);
        }

        //第二种使用迭代器进行遍历输出
        Iterator<String> iterator = list.iterator();    //获取一个迭代器对象
        while (iterator.hasNext()){                     //判断集合中当前位置下一个是否存在元素
            String next = iterator.next();              //获取当前位置的下一个元素
            System.out.println(next);
        }

        //删除元素
        list.remove(0); //根据索引值删除元素
        list.remove("第二个元素");   //根据元素值删除元素
        System.out.println(list.size()); //验证是否删除成功

List集合的典型特征就是有序且可重复，所以可以通过索引来取值。遍历也有两种不同的方式，都可以达到相同的效果。一种通过集合的大小逐一遍历内部的元素。另一种通过创建对应的迭代器对象，逐一迭代元素。

迭代器原理

关于迭代器工作原理，由下图解释：
在这里插入图片描述

Set集合

下面演示Set集合的其中一个常用的HashSet实现类的一些基本的用法

//实例化一个Set接口旗下的HashSet实现类
        HashSet<String> set = new HashSet<>();

        //向HashSet里存放值
        set.add("甲");
        set.add("乙");

        //由于Set是无序所以没有索引，只能用迭代器迭代出来
        Iterator<String> iterator1 = set.iterator();
        while (iterator1.hasNext()){
            String next = iterator1.next();
            System.out.println(next);
        }

        //移除值
        set.remove("甲");
        set.remove("乙");
        System.out.println(set.size());

Set由于是无序的，所以就不会像List集合那样存在索引可以取值，只能使用迭代器进行取值，因为其是通过每存一个元素就计算其的哈希码算出存放位置，所以也证明了其内部的元素不可能重复，因为相同的值哈希码必然相同。

map集合

下面是map集合，通过map接口下的一个常用的HashMap实现类进行基本的用法进行演示说明。

//创建Map集合
        Map<String,Integer> map = new HashMap<String,Integer>();

        //添加元素到map集合中
        map.put("第一个数",1);
        map.put("第二个数",2);

        //第一种方式
        Set<String> set1 = map.keySet();
        for (String s : set1){
            System.out.println("key="+s+",value="+map.get(s));
        }

        //第二种
        for (Map.Entry<String,Integer> entry: map.entrySet()) {
            System.out.println("key="+entry.getKey()+",value="+entry.getValue());
        }

        //第三种
        // 通过Map.entrySet使用iterator遍历key和value
        Iterator<Map.Entry<String, Integer>> entries = map.entrySet().iterator();
        while (entries.hasNext()) {
            Map.Entry<String, Integer> entry = entries.next();
            System.out.println(entry);
        }

        //移除元素
        map.remove("第一个数");
        map.remove("第二个数");
        System.out.println(map.size());

map集合比前面的两种集合略微复杂一些，但是功能也会更加强大和高效。map存放元素是以键值对的形式进行存放，一个键对应一个值，键和值分别通过Set集合和List集合进行设计并存放。其迭代方式有三种，一种是通过先取key值，再通过key值，取出value值。第二种通过获取map内部的一个封闭接口拿到所有的key-value值的对象，再逐一获取对应的key和value值。第三种其实就是把foreach遍历换成了iterator迭代器遍历。原理和第二种类似。

追根溯源

集合的大概结构和基本的用法我们都已经清楚了，下面我们看看如此强大的集合对象究竟是怎么形成的。通过点开集合的源码我们就可以一目了然其内部构造了。

ArrayList解析

首先看它的底层初始构造，我们打开类的搜索项，搜索ArrayList类，
在这里插入图片描述
我们可以看到在创建ArrayList集合对象底层其实创建一个数组，也就是说集合底层就是个数组，如果但是集合和数组有什么区别呢？

一开始先创建一个默认容量为10的数组进行存储，如果存储的数据量超过10的话，就会进行扩容，扩容量为1.5倍(oldCapacity >> 1)。普通数组长度是固定，但是List集合对象长度是可以变化的。下面我们看他如何取出数据
在这里插入图片描述

当它get取这个索引所指向的值时，会先进行checkIndex方法进行判断该索引是否越界，越界就抛出越界异常，否则就通过数组取出该索引的值。

Set解析

Set常用接口的实现类HashSet的底层其实是一个Map集合，谈到了map集合下面就会介绍，可以先看map集合的解析，看完后再回来看这里就清楚了。Set结构与List是完全不同的
在这里插入图片描述
再观察他的存值特点

set存储数据时用到了hash方法计算哈希码的方式进行存储，这样set集合就不会出现重复的元素了，但是同样也带来没有索引值取数据困难的局面。

Map解析

这里主讲map集合的底层创建以及扩容机制。map是一个内部比较复杂集合，因为他的功能比较多结构精巧。他的底层实现用到了负载因子，根据计算阈值来创建,公式为阈值=负载因子*容量，这负载因子默认为0.75，
在这里插入图片描述

我们可以看到这个对象初始化只是把负载因子赋值了，我们下面再看它的添加元素方法

这里通过把key和value作为参数进行传到真正实现存储的putVal方法

我们可以看到这里创建了两个数组进行存储，并且下面两步将需要储存的传来的参数key和value进行存储到刚创建的数组中进行保存
在这里插入图片描述
我们可以看到在添加元素时，在没有创建实例时初始化后，put方法里会判断容量是否为空，调用resize方法第一次赋值容量赋值为16，阈值赋值为0.7516=12。每当超过阈值就会进行扩容，之后每次扩容都是两倍。总之容量和阈值之间保持0.75的比例
以上的是无参构造器实现及扩容机制，下面看有参构造器的实现：

有参构造器构造集合时，以上该种构造器就不会用默认的系统容量，则会使用开发者所定义的参数容量，但会使用系统默认的负载因子，下面会判断是否超过最大容量，超出则赋予系统默认最大支持的容量。并且在最后一行给阈值进行了赋值

注意：初始容量设置为2的倍数的话是自定义容量，如果不是则容量是系统根据以上算法算出离设定参数最近的2的n倍的容量。但是最后编译器仍会把我们设置的容量屏蔽，假设设置的初始容量为8，那么阈值就是80.75=6，此时扩容就会造成内存浪费，一般系统把容量定义为16。