集合框架（一）Set系列集合

news2026/3/14 18:29:06

Set<E>是一个接口

特点

无序：添加数据的顺序和获取出的数据顺序不一致；不重复，无索引

注意：Set要用到的常用方法，基本上就是collection提供的!自己几乎没有额外新增一些常用功能!

HashSet集合的底层原理

前置知识：哈希值：就是一个int类型的数值，Java中每个对象都有一个哈希值。

HashSet集合的底层原理：基于哈希表（是一种增删改查数据，性能都较好的数据结构）实现。

哈希表

JDK8之前，哈希表=数组+链表
JDK8开始，哈希表=数组+链表+红黑树

问题：

1. 如果数组快占满了，会出什么问题?该咋办? 链表会过长，导致查询性能降低。

（哈希表有一种机制：扩容。就是把底层的数组长度扩大，再把元素放到新数组里面去，把他分散开来，这样就会使链表上的数据要少一些，性能就得到一定的优化。）一旦数组占满了16*0.75=12个位置了，他就会扩容，并不会等到把数组中所有的位置都占完。

扩容的话会扩容成原数组的两倍的样子，再把原数组中的数据重新转移到新数组中，这样就可以把链上的数据变得少一些都分散开来，这样他的查询性能也就得到优化了。

JDK8开始，当链表长度超过8，且数组长度>=64时，自动将链表转为红黑树。

如果要认为两个不同对象是重复的，就必须要重写这个对象的hashCode()方法和equal()方法。这样HashSet<>集合就会认为内容一样的两个对象是重复的，就会帮我们去掉一个重复的。

LinkedHashSet集合的底层原理

依旧是基于哈希表（数组、链表、红黑树）实现的。

但是，他的每个元素都额外多了一个双链表的机制记录他前后元素的位置。

TreeSet集合

特点:不重复、无索引、可排序(默认升序排序，按照元素的大小，由小到大排序）

底层是基于红黑树实现的排序。

注意:
对于数值类型:Integer，Double，默认按照数值本身的大小进行升序排序

对于字符串类型:默认按照首字符的编号升序排序。
对于自定义类型如Student对象，Treeset默认是无法直接排序的

这个代码可以简化，函数式接口的匿名内部类形式可以简化。

两种方式中，关于返回值的规则:
如果认为第一个元素 >第二个元素返回正整数即可。
如果认为第一个元素<第二个元素返回负整数即可。
如果认为第一个元素=第二个元素返回0即可，此时Treeset集合只会保留一个元素，认为两者重复。
注意:如果类本身有实现Comparable接口，Treest集合同时也自带比较器，默认使用集合自带的比较器排序。