【万文全解】Java集合源码解析【HashMap】【ArrayList】【JDK源码集合部分】

news2025/1/11 6:09:34

Java集合源码解析

本文主体部分是作者跟着B站韩顺平老师的课程总结而来,中间穿插自己的理解还有网上各类优质解答

第一节:集合介绍与集合体系图

集合与数组对比(引入集合的目的)

数组:

  1. 长度必须指定,一旦指定不能更改(无法动态扩容)
  2. 保存的是同一类元素

集合:

  1. 可以动态保存任意多个对象,比较方便
  2. 提供了方便操作对象的方法:add、remove、set、get等

主要是三类 List Set Map

  • List :存储有序、可重复
  • Set :存储无序、不可重复
  • Map : 使用k-v键值对进行存储

集合体系图1
集合体系图2

List

  • ArraylistObject[] 数组
  • VectorObject[] 数组
  • LinkedList : 双向链表(JDK1.6 之前为循环链表,JDK1.7 取消了循环)

Set

  • HashSet (⽆序,唯⼀): 基于 HashMap 实现的,底层采⽤ HashMap 来保存元素

  • LinkedHashSet : 是 HashSet 的⼦类,并且其内部是通过LinkedHashMap 来实现的。有点类似于我们之前说的 LinkedHashMap 其内部是基于HashMap 实现⼀样,不过还是有⼀点点区别的

  • TreeSet(有序,唯⼀): 红⿊树(⾃平衡的排序⼆叉树)

Map

  • HashMapJDK1.8 之前 HashMap 由数组+链表组成的,数组是 HashMap 的主体,链表则是主要为了解决哈希冲突⽽存在的(“拉链法”解决冲突)。JDK1.8 以后在解决哈希冲突时有了较大的变化,当链表⻓度大于阈值(默认为 8)(将链表转换成红⿊树前会判断,如果当前数组的⻓度小于 64,那么会选择先进⾏数组扩容,⽽不是转换为红⿊树)时,将链表转化为红⿊树,以减少搜索时间
  • LinkedHashMapLinkedHashMap 继承⾃ HashMap ,所以它的底层仍然是基于拉链式散列结构即由数组和链表或红⿊树组成。另外, LinkedHashMap 在上⾯结构的基础上,增加了⼀条双向链表,使得上⾯的结构可以保持键值对的插⼊顺序。同时通过对链表进⾏相应的操作,实现了访问顺序相关逻辑。
  • Hashtable : 数组+链表组成的
  • TreeMap : 红⿊树(⾃平衡的⼆叉排序树)

补充

二叉树 -> 二叉搜索(排序)树 BST-> 平衡二叉树AVL -> 红黑树 RBT

如果想学习或复习红黑树的小伙伴,可以沿着这条线来学习,在这里不展开了

第二节:Collection接口常用方法

通过ArrayList子类来演示

add 添加
remove 删除
contains 判断是否存在
size 获取元素个数
isEmpty  是否为空
clear  清空
addAll 添加多个元素
containsAll 判断多个元素是否存在
removeAll  删除多个元素
    public static void main(String[] args) {
        ArrayList list1 = new ArrayList();
        list1.add("Tom");
        list1.add(10); //等同于 list1.add(new Integer(10));
        list1.add(true);
        System.out.println("list="+list1);//list=[Tom, 10, true]
        list1.add(3,"cat"); // 按照索引添加指定位置
        //list1.add(5,"json"); // 报错,数组越界 java.lang.IndexOutOfBoundsException

        list1.remove("cat"); // 删除指定元素
        list1.remove(0);  // 删除指定位置的元素
        System.out.println("list="+list1);

        ArrayList list2 = new ArrayList();
        list2.add("java");
        list2.add("spring");
        list2.add("netty");
        list1.addAll(list2);
        System.out.println("list="+list1); // 添加整个集合  list=[10, true, java, spring, netty]

    }

第三节:迭代器遍历 + 增强for

public class Collection2 {

    public static void main(String[] args) {
        ArrayList list = new ArrayList();
        list.add(new Subject("java","nb"));
        list.add(new Subject("spring","framworks"));
        list.add(new Subject("spring-boot","yyds"));

        Iterator iterator = list.iterator();
        while (iterator.hasNext()) { // 快捷键 itit
            Object next =  iterator.next();
            System.out.println(next.toString());
        }
        //iterator.next();  // 越界报错 NoSuchElementException
        //此时迭代器的指针 指向最后一个元素,如果想要将指针指向首部
        iterator = list.iterator();
    }
}
class  Subject{
    public String name;
    public String desc;

    public Subject(String name,String desc){
        this.name = name;
        this.desc = desc;
    }

    public void setDesc(String desc) {
        this.desc = desc;
    }

    public String getDesc() {
        return desc;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    @Override
    public String toString() {
        return "Subject is "+this.getName() + "--" +this.getDesc();
    }
}
    public static void main(String[] args) {
        ArrayList list = new ArrayList();
        list.add(new Subject("java","nb"));
        list.add(new Subject("spring","framworks"));
        list.add(new Subject("spring-boot","yyds"));
		// 快捷键 I

        for (Object subject :list) {
            System.out.println(subject.toString());
        }

    }

第四节:ArrayList 底层源码

扩展:List接口方法

void add(int index,Object obj) 指定位置添加元素
Object get(int index) 获取指定位置元素
int indexOf(Object obj) 返回元素首次出现位置
int lastIndexOf(Object obj)
Object remove(int index)  删除指定位置元素
Object set(int index,Object obj) 替换
List subList(int fromIndex,int toIndex) 取出子集(前闭后开,>= from   &&  < toIndex )

ArrayList 扩容机制

线程不安全,执行效率高,多线程下不建议使用

  1. ArrayList维护了一个Object类型的数组elementData
  2. 当创建ArrayList对象时,如果使用的是无参构造器,则初始容量为0,第一次添加,扩容到10,如果需要再次扩容,则扩大1.5倍
  3. 如果使用指定大小构造器,则初始为指定大小,如果要扩容,也按照1.5倍扩容
    成员属性
    在这里插入图片描述

ArrayList 底层源码

1 首先,创建一个ArrayList对象

ArrayList arrayList = new ArrayList();

底层原理:调用无参构造器

 public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }
//常量DEFAULTCAPACITY_EMPTY_ELEMENTDATA 的值为“{}”,为空数组

即使用ArrayList()创建ArrayList对象时,并没有初始化底层数组elementData,等到调用add(E e) 方法的时候再初始化,这种"懒加载"模式可以节省内存。

2 调用add(E e) 方法

 for (int i = 0; i < 10; i++) {
            arrayList.add(i);
        }

底层原理:

public boolean add(E e) {
        // 确认elementData容量是否足够
        ensureCapacityInternal(size + 1);  // 第一次调用add()方法时,size=0
        elementData[size++] = e;
        return true;
    }

先调用ensureCapacityInternal(int minCapacity)方法,对数组容量进行检查,不够时则进行扩容。

private void ensureCapacityInternal(int minCapacity) {
    // 如果elementData为"{}"即第一次调用add(E e),重新定义minCapacity的值,赋值为DEFAULT_CAPACITY=10
    // 即第一次调用add(E e)方法时,定义底层数组elementData的长度为10
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }
	// 判断是否需要扩容
        ensureExplicitCapacity(minCapacity);
    }

ensureExplicitCapacity(minCapacity) 判断是否需要扩容

private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

// 第一次进入时,minCapacity=10,elementData.length=0,对数组进行扩容
// 之后再进入时,minCapacity=size+1,elementData.length=10(每次扩容后会改变),
// 需要minCapacity>elementData.length成立,才能扩容
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

grow(minCapacity) 对数组进行扩容

private void grow(int minCapacity) {
        // 将数组长度赋值给oldCapacity
        int oldCapacity = elementData.length;
    	// 将oldCapacity右移一位再加上oldCapacity,即相当于newCapacity=1.5oldCapacity(不考虑精度损失)
        int newCapacity = oldCapacity + (oldCapacity >> 1);
    	// 如果newCapacity还是小于minCapacity,直接将minCapacity赋值给newCapacity
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
    	// 特殊情况:newCapacity的值过大,直接将整型最大值赋给newCapacity,
	// 即newCapacity=Integer.MAX_VALUE
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // 将elementData的数据拷贝到扩容后的数组
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

// 如果大于临界值,进行整型最大值的分配
private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

第五节:Vector源码解析

  • Vector底层也是一个对象数组,Object[] elementData
  • Vector是线程同步的,即线程安全,是有synchronized修饰
  • 开发中如果需要线程安全,考虑使用Vector

VectorArrayList比较

底层结构版本安全/效率扩容倍数
ArrayList可变数组jdk1.2不安全、效率高如果有参构造1.5倍
如果无参,第一次10,第二次按照1.5倍
Vector可变数组jdk1.0安全、效率不高如果无参,默认10,第二次按照2倍
如果指定大小,则每次按照2倍

第六节:LinkedList源码解析

  1. LinkedList底层是一个双向链表
  2. LinkedList中有两个属性first last 分别指向头结点和尾结点
  3. 每个结点(Node对象)中又有三个属性 prev next item
  4. 添加和删除时间复杂度低,效率高
  5. 线程不安全的

在这里插入图片描述

private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

1 查找

LinkedList 查找过程要稍麻烦一些,需要从链表头结点(或尾节点)向后查找,时间复杂度为 O(N)

public E get(int index) {
    checkElementIndex(index);
    return node(index).item;
}

Node<E> node(int index) {
    /*
     * 查找位置 index 如果小于节点数量的一半,
     * 从头节点开始查找,否则从尾节点查找
     * >>  位运算符,相当于/2   << 相当于 *2
     */    
    if (index < (size >> 1)) {
        Node<E> x = first;
        // 循环向后查找,直至 i == index
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

2 遍历

从头节点往后遍历就行了。通常情况下,我们会使用 foreach 遍历 LinkedList,而 增强for 最终转换成迭代器形式。

public ListIterator<E> listIterator(int index) {
    checkPositionIndex(index);
    return new ListItr(index);
}

private class ListItr implements ListIterator<E> {
    private Node<E> lastReturned;
    private Node<E> next;
    private int nextIndex;
    private int expectedModCount = modCount;

    /** 构造方法将 next 引用指向指定位置的节点 */
    ListItr(int index) {
        // assert isPositionIndex(index);
        next = (index == size) ? null : node(index);
        nextIndex = index;
    }

    public boolean hasNext() {
        return nextIndex < size;
    }

    public E next() {
        checkForComodification();
        if (!hasNext())
            throw new NoSuchElementException();

        lastReturned = next;
        next = next.next;    // 调用 next 方法后,next 引用都会指向他的后继节点
        nextIndex++;
        return lastReturned.item;
    }

    // 省略部分方法
}

3 插入

链表的优势所在

/** 在链表尾部插入元素 */
public boolean add(E e) {
    linkLast(e);
    return true;
}

/** 在链表指定位置插入元素 */
public void add(int index, E element) {
    checkPositionIndex(index);

    // 判断 index 是不是链表尾部位置,如果是,直接将元素节点插入链表尾部即可
    if (index == size)
        linkLast(element);
    else
        linkBefore(element, node(index));
}

/** 将元素节点插入到链表尾部 */
void linkLast(E e) {
    // 将尾指针保存
    final Node<E> l = last;
    // 创建节点,并指定节点前驱为链表尾节点 last,后继引用为空
    final Node<E> newNode = new Node<>(l, e, null);
    // 将 last 引用指向新节点
    last = newNode;
    // 判断尾节点是否为空,为空表示当前链表还没有节点
    if (l == null)
        first = newNode;
    else
        l.next = newNode;    // 让原尾节点后继引用 next 指向新的尾节点
    size++;
    modCount++;
}

/** 将元素节点插入到 succ 之前的位置 */
void linkBefore(E e, Node<E> succ) {
    // assert succ != null;
    final Node<E> pred = succ.prev;
    // 1. 初始化节点,并指明前驱和后继节点
    final Node<E> newNode = new Node<>(pred, e, succ);
    // 2. 将 succ 节点前驱引用 prev 指向新节点
    succ.prev = newNode;
    // 判断尾节点是否为空,为空表示当前链表还没有节点    
    if (pred == null)
        first = newNode;
    else
        pred.next = newNode;   // 3. succ 节点前驱的后继引用指向新节点
    size++;
    modCount++;
}

下面为linkBefore 插入到指定位置的图示

在这里插入图片描述

4 删除

public boolean remove(Object o) {
    if (o == null) {
        for (Node<E> x = first; x != null; x = x.next) {
            if (x.item == null) {
                unlink(x);
                return true;
            }
        }
    } else {
        // 遍历链表,找到要删除的节点
        for (Node<E> x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                unlink(x);    // 将节点从链表中移除
                return true;
            }
        }
    }
    return false;
}

public E remove(int index) {
    checkElementIndex(index);
    // 通过 node 方法定位节点,并调用 unlink 将节点从链表中移除
    return unlink(node(index));
}

/** 将某个节点从链表中移除 */
E unlink(Node<E> x) {
    // assert x != null;
    final E element = x.item;
    final Node<E> next = x.next;
    final Node<E> prev = x.prev;

    // prev 为空,表明删除的是头节点
    if (prev == null) {
        first = next;
    } else {
        // 将 x 的前驱的后继指向 x 的后继
        prev.next = next;
        // 将 x 的前驱引用置空,断开与前驱的链接
        x.prev = null;
    }

    // next 为空,表明删除的是尾节点
    if (next == null) {
        last = prev;
    } else {
        // 将 x 的后继的前驱指向 x 的前驱
        next.prev = prev;
        // 将 x 的后继引用置空,断开与后继的链接
        x.next = null;
    }

    // 将 item 置空,方便 GC 回收
    x.item = null;
    size--;
    modCount++;
    return element;
}

简单来说:构建2个指针,删除4个指针

在这里插入图片描述

第 七节:HashSetHashMap 源码

  1. 无序(添加顺序和取出顺序不一致),没有索引
  2. 不允许重复元素,最多只有一个null
  3. 虽然取出顺序和添加顺序不一致,但是取出顺序是固定的,每次都一样
  4. 遍历方式:迭代器、增强for,但是不能通过索引

HashSet底层其实是 HashMapHashMap底层是数组+链表+红黑树

1 引入案例

为什么有些能重复,有些不能重复

public class HashSet1 {
    public static void main(String[] args) {


        HashSet set = new HashSet();
        System.out.println(set.add("java"));// true,相当于 new String("java")
        System.out.println(set.add("java"));// false,都是加在常量池中,所以判断重复

        System.out.println(set.add(new Lesson("spring")));// true
        System.out.println(set.add(new Lesson("spring")));// true
        // 打印结果: hashSet = [java, com.liangchen.Lesson@4554617c, com.liangchen.Lesson@1b6d3586] 可以看到地址是不同的
        System.out.println("hashSet = " + set);

        System.out.println(set.add(new String("redis")));// true
        System.out.println(set.add(new String("redis")));// false
        System.out.println("hashSet = " + set);
    }
}
class Lesson{
    private String name;

    public Lesson(String name) {
        this.name = name;
    }
}

需要先看后面的源码解析部分

解析如下:

  1. 判断是否重复原理

    if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
    
    • 首先判断 hash值 是否相同 ,是 hashcode 位运算得到的,结合上面例子 两个Lesson()是不同的对象,hash值 肯定不同,如图
    • 通过 == 判断 两个对象的 内存地址是否一样,也就是说是否为同一个对象
    • 最后通过 equals方法来比较,默认跟 == 一样,也是比较内存地址,但是该方法是可以由程序员重写的,自定义判断方法,比如:
    class Lesson{
        private String name;
    
        public Lesson(String name) {
            this.name = name;
        }
    	
        @Override
        public boolean equals(Object o) {
            if (this == o) return true;
            if (o == null || getClass() != o.getClass()) return false;
            Lesson lesson = (Lesson) o;
            // 只要 name 相同,就认为是 同一个对象
            return Objects.equals(name, lesson.name);
        }
        // 只要 name 相同就产生一样的hashcode  (多个成员属性也是同样道理)
        @Override
        public int hashCode() {
            return Objects.hash(name);
        }
    }
    

在这里插入图片描述

2 使用数组+链表 模拟HashMap

public class HashMapDemo {
    public static void main(String[] args) {
        // 使用 数组 + 链表 模拟 HashMap

        Node[] table = new Node[16];
        // 创建一个 结点
        Node nodeFrameWork = new Node("framework", null);
        table[2] = nodeFrameWork; // 保存到 数组 索引为 2 的位置
        Node nodeSpring = new Node("spring", null);
        Node nodeSpringBoot = new Node("springBoot", null);
        nodeFrameWork.next = nodeSpring; // 将 [spring] 结点 挂在到 [framework] 结点上,组成链表
        nodeSpring.next = nodeSpringBoot; // 将 [springBoot] 结点 挂在到 [spring] 结点上,组成链表

        Node nodeMQ = new Node("MQ", null);
        table[4] = nodeMQ; // 保存到 数组 索引为 4 的位置
        Node nodeRabbitMQ = new Node("rabbitMQ", null);
        Node nodeKafka = new Node("kafka", null);
        nodeMQ.next = nodeRabbitMQ; // 将 [rabbitMQ] 结点 挂在到 [MQ] 结点上,组成链表
        nodeRabbitMQ.next = nodeKafka; // 将 [kafka] 结点 挂在到 [rabbitMQ] 结点上,组成链表
    }
}

class Node{
    Object name;
    Node   next;

    public Node(Object name, Node next) {
        this.name = name;
        this.next = next;
    }
}

使用Debugger 查看内存结构如下:

在这里插入图片描述

3 源码分析

  1. HashSet 底层是 HashMap

  2. 添加一个元素时,先得到 hash值,会转换成 索引值

  3. 找到存储数据表的 table ,检查这个索引位置是否已存放数据元素

  4. 如果没有,直接加入

  5. 如果有,调用 equals() 比较,相同舍弃,不同则添加到最后

  6. Java8中,如果一条链表的元素个数到达默认值 8 个,并且table的大小大于 64,就会将链表 树化 转换成 红黑树,否则仍然采用数组扩容机制,扩大2倍

  7. 构造函数,底层使用的是HashMap

注意几个参数

initialCapacity 初始容量,默认16

laodFactor 加载/负载因子,默认0.75

threshold 阈值,默认 16*0.75 = 12

public HashSet() {
     map = new HashMap<>();
}
  1. 添加元素的add方法,会调用HashMap的put方法
public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}
  1. 执行put方法,key是传入参数(存储的值,比如”张三“”hello world“),value是一个Object对象,占位,不放东西,始终不变
public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}
  1. 计算hash值,得到key对应的hash值,并不等同于hashcode,是 hashcode进行了位运算之后的数值
static final int hash(Object key) {
     int h;
     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
  1. 进入putVal
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;  //定义辅助变量
        // if语句表示,如果当前table是null,或者大小为0,进行第一次扩容,到16个空间
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        // 根据key,得到的hash值,计算key应该存放到table表的哪个索引位置,并把这个位置的对象赋值给 p
        // 判断 p 是否为空,如果为空表示还没放置过元素,就创建一个Node
        // p 就是计算出的 索引位置
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {  //如果p 不为空,证明已经放置过元素
            Node<K,V> e; K k;
            // 如果当前索引位置对应的链表的第一个元素和准备添加的key的hash值相同
            // 并且满足准备加入的 key 和 p 指向的Node节点的key是同一个对象  或者 内容相同
            // equals方法由程序员重写来决定,比如比较Person对象,1-名字相同 2-名字+性别相同 3-名字+身份证号相同,都是不固定的
            // 不能加入
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            // 再判断 p 是不是红黑树
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);  //如果是红黑树,调用putTreeVal添加
            else {
                //如果table对应的索引位置是一个链表,遍历链表进行判断
                for (int binCount = 0; ; ++binCount) {
                    // 这里判断是否为 链表 的最后一个结点
                    if ((e = p.next) == null) { // 依次和该链表的每一个元素比较后都不相同,则加入到该链表的最后
                        p.next = newNode(hash, key, value, null);
                        //添加到链表之后,立即判断该链表是否已经达到8个结点,达到了8个节点进行树化
                        // 是否真的树化,还需要判断表的长度是否超过64,小于64只是进行数组的扩容
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 依次比较,如果有相同的直接break
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            // 如果存在该值,就用新值覆盖旧值,同时会返回旧值
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        //size是每加入一个结点,size就会加一(并不是table中的索引被使用了12个才会扩容,而是加入的元素个数到达了12就要扩容,此时可能有4个元素在索引为1的地方,8个元素在索引为4的地方)
        if (++size > threshold)   //判断是否扩容,第一次添加的时候,table数组扩容到16,临界值是(16*加载因子)(默认是0.75)(第一次就是16*0.75=12),到达临界值进行扩容
            resize();
        afterNodeInsertion(evict);  //子类使用,HashMap是一个空方法
        return null;
    }

HashMap作用和遍历方式

  1. 保存key-value 映射关系数据
  2. Mapkey 不能重复(如果相同key,则会被后者覆盖),value可以重复

遍历的主要使用方式

  • keySet 获取所有的键

  • entrySet 获取所有映射关系 EntrySet<Map.Entry<K,V>>

  • values 获取所有的值

下图主要想说明HashMap的基础数据单元Entry<K,V> 和整体的图解(数组+链表)(未树化)

在这里插入图片描述

4 Debugger 调试查看HashSet扩容机制

public static void main(String[] args) {

        HashSet set = new HashSet();
        for (int i = 0; i < 100; i++) {
            set.add(i);
        }
    }
  1. 当第一次初始化HashSet时,默认大小为16,阈值为12

在这里插入图片描述

  1. 当添加元素个数超过阈值时,自动扩容两倍

在这里插入图片描述

  1. 同理最后扩大到64->128,因为不满足树化条件(1-如果一条链表的元素个数到达默认值 8 个 2-table的大小大于 64),所以继续采用数组扩容机制扩大2倍

5 Debugger 调试查看HashSet树化扩容机制

public class HashSet2 {
    public static void main(String[] args) {

        HashSet set = new HashSet();

        for (int i = 0; i < 12; i++) {
            set.add(new Dog("dog"+i));
        }

    }
}
class Dog{
    private String name;

    public Dog(String name) {
        this.name = name;
    }

    //重写方法,返回相同的hashcode
    @Override
    public int hashCode() {
        return 100;
    }
}
  1. 取个中间状态,比如添加了4个元素,数据结构如下:

在这里插入图片描述

  1. 当添加了8个元素,只满足了 树化 的一个条件(某条链表到达8个),但是不满足整体table 大于64,所以进行数组扩容,由 16 -> 32 -> 64
  2. 当满足两个条件时,底层进行树化,将链表 转化为 红黑树

在这里插入图片描述

扩容之后,要重新计算键值对的位置,并把它们移动到合适的位置上去
如上所示:原本在索引4的位置,扩容之后迁移到索引为36的位置

在这里插入图片描述

第八节:LinkedHashSet LinkedHashMap 源码解析

  1. LinkedHashSet底层是LinkedHashMap,底层是 数组 + 双向链表
  2. LinkedHashSet加入顺序和取出元素的顺序是一致的

因为底层是LinkedHashMap,我们可以看这张图

在这里插入图片描述

简单看下源码,重点是中间的 entry这数据对象

static class Entry<K,V> extends HashMap.Node<K,V> {
    // 可以看到 它继承了 HashMap中的 Node结点(有一个next指针)
    // 同时又新增了两个指针,前驱指针before,后继指针after
    Entry<K,V> before, after;
    Entry(int hash, K key, V value, Node<K,V> next) {
        super(hash, key, value, next);
    }
}

在这里插入图片描述

第九节:TreeSet TreeMap 源码解析

进行源码分析前,需要说明个容易误解的地方,底层使用的是红黑树,我们暂时可以不用分析,重点要注意存储的对象是Entry<K,V>是进行保存键值对的

但是TreeSet仅是单列数据,不是键值对,所以规定 K表示所要保存的数据,而V用一个new object固定占位符替代;跟上面分析HashSetHashMap异曲同工

public class TreeSet01 {
    public static void main(String[] args) {

//        TreeSet treeSet = new TreeSet();

        TreeSet treeSet = new TreeSet(new Comparator() {
            @Override
            public int compare(Object o1, Object o2) {
                // 通过字符串的ASCII比较大小  打印结果  [c, c++, java, php, python],此处请看源码分析
                return ((String) o1).compareTo ((String) o2);

                // 通过比较字符串长度, 打印结果  [c, c++, java, python]j,此时已插入长度为3的字符串c++,所以最后插入php时就插入不了
                // 通过源码分析,同理。此处比较的是字符串长度,当插入php时,已经存在了【c,c++,java,python】,进入循环体比较时,
                // 已经存在了长度为3的字符串,则仅仅只替换value,但此时的数据结构是Entry<K,V>  K->数据,V表示一个默认对象的占位符
                
                //return (((String) o1).length() - ((String) o2).length());
            }
        });

        /**
         *   如果使用默认的构造器,是按照ASCII排序
         *   如果想要排序,则需要自定义比较器,通过匿名内部类传入
         */

        treeSet.add("java");
        treeSet.add("python");
        treeSet.add("c");
        treeSet.add("java");
        treeSet.add("c++");
        treeSet.add("php");

        System.out.println(treeSet);
    }
}
// 此处是 TreeMap的底层添加方法
// 依此添加  java->python->c->java->c++ 我们重点比较插入相同元素的比较过程
// 如果是TreeSet调用,则值是key, value可以理解为一个固定的占位符;如果是TreeMap调用,则是键值对
public V put(K key, V value) {
        Entry<K,V> t = root;
    	// 添加首个元素时,root == null,后面添加就不进入判断
        if (t == null) {
            //添加第一个元素,只能自己与自己比较
            compare(key, key);

            root = new Entry<>(key, value, null);
            size = 1;
            modCount++;
            return null;
        }
        int cmp;
        Entry<K,V> parent;
        // split comparator and comparable paths
    	// 调用我们自定义的比较器
        Comparator<? super K> cpr = comparator;
    	// 此时TreeMap中存在 【java,python,c】三个元素,循环依此比较(使用比较器的自定义方法)
        if (cpr != null) {
            do {
                parent = t;
                cmp = cpr.compare(key, t.key);
                if (cmp < 0)
                    t = t.left;
                else if (cmp > 0)
                    t = t.right;
                else
                    // 此时比较得到 0 ,表示插入数据,已经存在,则覆盖value值
                    // 注意上面提到的,TreeSet中,key是值,value是一个对象占位符,无意义的,此时setVaule,并没有改变key的值,所以还是原来的值
                    return t.setValue(value);
            } while (t != null);
        }
        else {
        	//省略
        }
        Entry<K,V> e = new Entry<>(key, value, parent);
        if (cmp < 0)
            parent.left = e;
        else
            parent.right = e;
        fixAfterInsertion(e);
        size++;
        modCount++;
        return null;
    }

第十节:HashTable

哈希表、散列表

  1. 存放的是键值对 k - v
  2. 键和值都不能为null
  3. hashTable是线程安全的,hashMap是线程不安全的

整体扩容机制与HashMap类似

第十一节:Properties

  1. properties主要用于 从 .properties 文件中,加载数据到properties类对象,并读取和修改

第十二节:开发中如何选择集合的实现类

  1. 先判断存储的数据类型(是一组对象、还是一组键值对)
  2. 一组对象,选择Collction接口下的ListSet
    1. 允许数据重复,则选择List
      • 增删频繁,选择LinkedList(底层使用双向链表实现)
      • 修改查询频繁,选择ArrayList(底层使用的是Object类型的可变数组)
    2. 不允许数据重复,则选择Set
      • 允许无序排列,选择HashSet(底层使用HashMap,使用数组+链表+红黑树)
      • 要求排序,选择TreeSet(底层使用TreeMap,使用红黑树)
      • 只要求插入和取出顺序一致,则选择LinkedHashSet(底层使用 数组+双向链表)
  3. 一组键值对,选择Map接口下的实现类
    1. 键无序排列,则选择HashMap(在JDK8中,使用数组+链表+红黑树)
    2. 键要排序,则选择TreeMap(底层使用红黑树)
    3. 键插入顺序和取出顺序一致,选择LinkedHashMap

第十三节:Collections工具类

Collections上一个操作Set List Map 集合的工具列,提供静态方法可以方便的进行排序、查询、修改操作

  • reverse(List) 反转List中元素
  • shuffle(List) 随机取出
  • sort(List) 默认排序ASCII
  • sort(List,Comparator) 自定义比较器排序
  • swap(List,int,int) 交换两个位置数据
  • max
  • min
  • frequency(Collection,Object) 返回指定集合中,某个元素出现的次数
  • copy(List desc,List src) 复制
  • replaceAll(List list,Object old,Object new) 替换

参考
《LinkedHashMap 源码详细分析(JDK1.8)》https://www.imooc.com/article/22931

《详解Java集合框架LinkedHashSet和LinkedHashMap源码剖析(图)》https://www.php.cn/java-article-359154.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/195373.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

javaEE 初阶 — TCP 流套接字编程

文章目录1. TCP 流套接字1.1 ServerSocket API1.2 Socket API1.3 TCP中的长短连接2. TCP 版本的回显服务器3. TCP 版本的回显客户端4. 如何给多个客户端提供服务1. TCP 流套接字 TCP 不需要一个类&#xff1b;来表示 “TCP” 数据报。 TCP 不是以数据报为单位进行传输的&#x…

拉伯配资“十年一剑”硕果累累 我国注册制改革迈入新征程

从2013年党的十八届三中全会明确提出“推动股票发行注册制变革”&#xff0c;到首届进博会上宣告科创板试点注册制&#xff0c;再到本年2月1日全面施行股票发行注册制变革正式发动&#xff0c;十年风雨兼程&#xff0c;我国注册制逐渐从“试点”走向“全面”。 2013年11月&…

编译链接过程详解

写在前面&#xff1a; 大家都知道&#xff0c;我们在编译器中建好一个**.c或.cpp 文件**&#xff0c;经过编译之后就可以运行了&#xff0c;也就是说我们写的.c 文件最后会变成一个可执行程序&#xff0c;那么 .c 或者 .cpp 文件是如何变成一个可执行程序的呢&#xff1f; 主要…

Vue计算属性和监视属性

目录 计算属性computed 监事属性 深度监视 计算属性computed 计算属性: 定义&#xff1a;要用的属性不存在&#xff0c;要通过已有属性计算得来 2、原理&#xff1a;底层借助了Object.defineproperty方法提供的getter和setter 3、get函数什么时候执行&#xff1f; 1、初…

移动硬盘修复的有效方法,恢复移动硬盘的数据这么做!

硬盘是计算机中的存储设备&#xff0c;是非常重要的部分。当硬盘发生故障&#xff0c;很可能会导致我们电脑里面的数据丢失。所以移动硬盘发生故障&#xff0c;我们一定要想办法修复它。 有没有什么操作方法&#xff0c;我们自己也可以简单进行&#xff1f;移动硬盘修复其实也…

mariadb数据库删除恢复过程

不作不死&#xff0c;不小心使sqlyog导数据选错服务器。把生产机的数据全部删除了。可怕的数据没有做其他过多的备份&#xff0c;只是每天自动crontab 备份。该怎么办呢&#xff1f;头脑一片空白。快&#xff0c; 赶紧看看日备份有没有。马上切换到备份目录&#xff0c;喜出望外…

构建指标体系是一套数据分析的框架,比如看哪些指标,这些指标变化了就会反映什么问题,是这样的吗?

指标体系是指由若干个反映企业业务运营特征的相对独立又相互联系的统计指标所组成的有机整体。近年来&#xff0c;各类企业逐渐认识到业务指标的重要性&#xff0c;从管理者们长期关注的企业绩效考核&#xff0c;到用来体现信息化水平的数据可视化大屏&#xff0c;其背后都离不…

【IoT】寻光智能车与循迹智能车

1、寻光智能车 功能说明 智能寻光小车&#xff0c;智能识别光线强弱&#xff0c;实现小车永远向光最强的地方行走&#xff0c;到光源处小车自动停止。基本车体为三轮、二驱、双层机构。主控芯片采用最常用的51单片机&#xff1b; 驱动采用L9110驱动芯片驱动两个减速直流电机…

Veeam ONE v12 发布 (含下载) - 面向所有工作负载的 IT 监控解决方案

Veeam Availability Suite v12 请访问原文链接&#xff1a;https://sysin.org/blog/veeam-one-12/&#xff0c;查看最新版。原创作品&#xff0c;转载请保留出处。 作者主页&#xff1a;www.sysin.org 概述 保持全面可视性和控制力&#xff0c;以高效执行管理、优化、计划和…

域渗透漏洞

一、域内提权漏洞 (CVE-2021-42287和CVE-2021-42278) 1.1 漏洞介绍 1.1.1 CVE-2021-42278 主机账户的名称尾部应该有一个 $(即 sAMAccountName 属性)&#xff0c;但是域控对此属性并没有任何验证来确保是否带有 $&#xff0c;这允许攻击者模拟域控主机账户。 1.1.2 CVE-2021-42…

python带你制作自动答题程序,速度超越98%人

前言 嗨喽~大家好呀&#xff0c;这里是魔王呐 ❤ ~! 目录前言环境使用:模块使用:自动答题思路步骤:代码展示尾语 &#x1f49d;环境使用: Python 3.8 –> 解释器 <执行python代码> Pycharm –> 编辑器 <写python代码的> 模块使用: import requests —&g…

Springboot_vue摄影作品图片展示交流平台

前后端通讯一般都是采取标准的JSON格式来交互。 前后端分离 的核心思想是前端页面通过 ajax 调用后端的 restuful api 进行数据交互&#xff0c;而 单页面应用&#xff08;single page web application&#xff0c;SPA&#xff09;&#xff0c;就是只有一张页面&#xff0c;并在…

https解决方案-利用keytool生成证书

https解决方案 1:什么是HTTPS&#xff1f; HTTPS其实是有两部分组成&#xff1a;HTTP SSL / TLS&#xff0c; 也就是在HTTP上又加了一层处理加密信息的模块&#xff0c;并且会进行身份的验证。 2:什么是自签名证书&#xff1f; 就是自己生成的证书&#xff0c;并不是官方…

计算机中的大小端存储

在讲C语言的时候&#xff0c;有讲到大小端的内容&#xff0c;这里呢对大小端的相关内容进行了整理&#xff0c;有需要的可以参考一下&#xff01; 大端和小端来自一个小故事&#xff1a;端模式(Endian)的这个词出自Jonathan Swift书写的《格列佛游记》。这本书根据将鸡蛋敲开的…

mysql导致索引失效的常见情况以及命名规范索引计划分析

1、失效的情况 1.前导模糊查询不能利用索引(like ‘%XX’或者like ‘%XX%’) 假如有这样一列code的值为’AAA’,‘AAB’,‘BAA’,‘BAB’ ,如果where code like %AB’条件&#xff0c;由于前面是 模糊的&#xff0c;所以不能利用索引的顺序&#xff0c;必须一个个去找&#xf…

虚拟机的Linux安装redis

1&#xff0c;下载redis 可以去官网下载压缩包 2&#xff0c;环境准备 我看很多文章都说要安装yum&#xff0c;但是在终端界面一直都是安装失败&#xff0c;后面才知道我的虚拟机是Ubuntu版本&#xff0c;而Ubuntu版本一般不使用yum命令&#xff0c;一般都是使用apt-get命令…

RANSAC: Random Sample Consensus

目录RANSAC算法基本思想和流程迭代次数推导参考RANSAC RANSAC(RAndom SAmple Consensus,随机采样一致)算法是从一组含有外点(outliers)的数据中正确估计数学模型参数的迭代算法。“外点”一般指的的数据中的噪声&#xff0c;比如说匹配中的误匹配和估计曲线中的离群点。所以&a…

电脑黑屏却开着机是怎么回事?解决黑屏的快捷方法

我们经常会用到电脑&#xff0c;但是你真的了解电脑相关知识吗&#xff1f;遇到比较复杂的电脑问题&#xff0c;你是否会手足无措&#xff1f;电脑黑屏却开着机这是什么原因造成的&#xff0c;我们有什么好办法恢复黑屏的电脑吗&#xff1f; 本文针对电脑黑屏却开着机的情况&a…

PCB生产工艺 | 第三道之沉铜,你都了解吗?

衔接上文&#xff0c;继续为朋友们分享普通单双面板的生产工艺流程。 如图&#xff0c;第三道主流程为沉铜。 沉铜的目的为&#xff1a; 在整个印制板&#xff08;尤其是孔壁&#xff09;上沉积一层薄铜&#xff0c;以便随后进行孔内电镀&#xff0c;使孔金属化&#xff08;孔…

小众点评项目要点内容总结【面试用】

小众点评项目要点 文章目录小众点评项目要点1.使用Redis代替Session登录1.1 Session登录存在的问题1.2 使用Redis代替Session登录分析1.3 使用Redis登录的流程1.4 解决Redis中有效期问题2.使用Redis作为缓存2.1 为什么使用缓存2.2 缓存策略2.3 解决缓存穿透2.4 解决缓存雪崩2.5…