- 每一个集合类底层采用的数据结构不同,例如ArrayList集合底层采用了数组,LinkedList集合底层采用了双向链表,HashMap集合底层采用了哈希表,TreeMap集合底层采用了红黑树。
- **集合中存储的是引用。**即。集合中存放的是对象的地址,而不是把堆中的实例对象存储。
- 默认情况下,如果不使用泛型的话,集合中可以存储任何类型的引用,只要是 Object 的子类都可以存储。
- Java集合框架相关的类都在 java.util 包下。
- Java 集合框架有两大支线:
- Collection,可进一步细分为
- List:可重复的集合。具体实现有:
ArrayList(动态数组)
和LinkedList(双向链表)
; - Set:不可重复的集合,典型代表就是
HashSet(哈希表)
和TreeSet(红黑树)
; - Queue:队列。具体实现有:双端队列
ArrayDeque
,以及优先级队列PriorityQueue
。
- List:可重复的集合。具体实现有:
- Map:键值对的集合。具体实现有:
HashMap
、LinkedHashMap(双向链表 + 哈希表)
- Collection,可进一步细分为
- 这些具体实现中,只有 TreeSet、LinkedHashMap 是有序的(
键有序
)
Collection
1、List
List 的特点是存取有序,可以存放重复的元素,可以用下标对元素进行操作。
1.1 ArrayList
- ArrayList 是由数组实现的,支持随机存取,也就是可以通过下标直接存取元素;
- 从尾部插入和删除元素会比较快捷,从中间插入和删除元素会比较低效,这是由数组的特点决定的;
- 如果内部数组的容量不足时会自动扩容,因此当元素非常庞大的时候,效率会比较低。
1.2 LinkedList
- LinkedList 是由双向链表实现的,不支持随机存取,只能从一端开始遍历,直到找到需要的元素后返回;
- 任意位置插入和删除元素都很方便,因为只需要改变前一个节点和后一个节点的引用即可,不像 ArrayList 那样需要复制和移动数组元素,这是由链表的特点决定的;
- 因为每个元素都存储了前一个和后一个节点的引用,所以相对来说,占用的内存空间会比 ArrayList 多一些。
// CRUD 实例
// 创建一个集合
LinkedList<String> list = new LinkedList<String>();
// 添加元素
list.add("apple");
list.add("avocado");
// 遍历集合 for 循环
for (int i = 0; i < list.size(); i++) {
String s = list.get(i);
System.out.println(s);
}
// 遍历集合 for each
for (String s : list) {
System.out.println(s);
}
// 删除元素
list.remove(1);
// 遍历集合
for (String s : list) {
System.out.println(s);
}
// 修改元素
list.set(1, "apricot");
1.3 ArrayList 和 LinkedList
通常,我们总是优先使用 ArrayList。
1.4 Vector 和 Stack
List 的实现类还有一个 Vector,是一个元老级的类,比 ArrayList 出现得更早。
ArrayList 和 Vector 非常相似,只不过 Vector 是线程安全的,像 get、set、add 这些方法都加了 synchronized 关键字,就导致执行效率会比较低,所以现在已经很少用了。
这种加了同步方法的类,注定会被淘汰掉,就像StringBuilder 取代 StringBuffer那样。
Stack 是 Vector 的一个子类,本质上也是由动态数组实现的,只不过还实现了先进后出的功能(在 get、set、add 方法的基础上追加了 pop「返回并移除栈顶的元素」、peek「只返回栈顶元素」等方法),所以叫栈。
由于 Stack 执行效率比较低(方法上同样加了 synchronized 关键字),就被双端队列 ArrayDeque 取代了(下面会介绍)。
1.5 List 接口 的 API
List 接口继承自 Collection。自然,Collection 定义的 API,List 也有。
以下给出 List 特有的 API:
void add(int index, E element) 在指定索引处插入元素
E set(int index, E element); 修改索引处的元素
E get(int index); 根据索引获取元素(通过这个方法List集合具有自己特殊的遍历方式:根据下标遍历)
E remove(int index); 删除索引处的元素
int indexOf(Object o); 获取对象o在当前集合中第一次出现时的索引。
int lastIndexOf(Object o); 获取对象o在当前集合中最后一次出现时的索引。
List<E> subList(int fromIndex, int toIndex); 截取子List集合生成一个新集合(对原集合无影响)。[fromIndex, toIndex)
static List<E> of(E... elements); 静态方法,返回包含任意数量元素的不可修改列表。(获取的集合是只读的,不可修改的。)
2、Set
3、Queue
3.1 ArrayDeque
ArrayDeque 是一个基于数组实现的双端队列,为了满足可以同时在数组两端插入或删除元素的需求,数组必须是循环的,也就是说数组的任何一点都可以被看作是起点或者终点。
3.2 LinkedList
LinkedList 一般应该归在 List 下,只不过,它也实现了 Deque 接口,可以作为队列来使用。
实际上,LinkedList 同时实现了 Stack、Queue、PriorityQueue 的所有功能。
// 演示 LinkedList 的队列特性
LinkedList<String> queue = new LinkedList<>();
// 区别于 add, offer元素用于向队尾添加元素
queue.offer("apple");
queue.offer("avocado");
System.out.println(queue); // 输出 [apple, avocado]
// 删除元素
queue.poll();
System.out.println(queue); // 输出 [avocado]
// 修改元素:LinkedList 中的元素不支持直接修改,需要先删除再添加
String first = queue.poll();
queue.offer("apple");
System.out.println(queue); // 输出 [apple]
// 查找元素:既可以查找下标,也可以查找内容
System.out.println(queue.get(0)); // 输出 apple
System.out.println(queue.contains("apricot")); // 输出 false
// 查找元素:使用迭代器的方式查找陈清扬
// 使用迭代器依次遍历元素并查找
Iterator<String> iterator = queue.iterator();
while (iterator.hasNext()) {
String element = iterator.next();
if (element.equals("apple")) {
System.out.println("找到了:" + element);
break;
}
}
3.2.1 add–remove / offer–poll
LinkedList 同时实现了 List 和 Deque(双端队列)接口,因此,其同时拥有两组插入/删除的方法:
- add–remove:List 接口中定义的方法
- 在 LinkedList 实例的尾部进行插入和删除
- offer–poll:Deque 接口中定义的方法
- 在 LinkedList 实例的尾部进行插入,头部进行删除(即队列的特征)
3.3 ArrayDeque 和 LinkedList
LinkedList 和 ArrayDeque 都是 Java 集合框架中的双向队列(deque),它们都支持在队列的两端进行元素的插入和删除操作。
不过,LinkedList 和 ArrayDeque 在实现上有一些不同:
- 底层实现方式不同:LinkedList 是基于链表实现的,而 ArrayDeque 是基于数组实现的。
- 随机访问的效率不同:由于底层实现方式的不同,LinkedList 对于随机访问的效率较低,时间复杂度为 O(n),而 ArrayDeque 可以通过下标随机访问元素,时间复杂度为 O(1)。
- 迭代器的效率不同:LinkedList 对于迭代器的效率比较低,因为需要通过链表进行遍历,时间复杂度为 O(n),而 ArrayDeque 的迭代器效率比较高,因为可以直接访问数组中的元素,时间复杂度为 O(1)。
- 内存占用不同:由于 LinkedList 是基于链表实现的,它在存储元素时需要额外的空间来存储链表节点,因此内存占用相对较高,而 ArrayDeque 是基于数组实现的,内存占用相对较低。
- 如何选择?
- 如果需要在双向队列的两端进行频繁的插入和删除操作,并且需要随机访问元素,可以考虑使用 ArrayDeque;
- 如果需要在队列中间进行频繁的插入和删除操作,可以考虑使用 LinkedList。‘
3.4 PriorityQueue
PriorityQueue 是一种优先级队列,它的出队顺序与元素的优先级有关,执行 remove 或者 poll 方法,返回的总是优先级最高的元素。
4、Collection 接口的 API
Collection 接口中定义了如下 API。自然,所有实现了 Collection 接口的类(List、Set、Queue)都能使用这些方法。
boolean add(E e); 向集合中添加元素
int size(); 获取集合中元素个数
boolean addAll(Collection c); 将参数集合中所有元素全部加入当前集合
boolean contains(Object o); 判断集合中是否包含对象o
boolean remove(Object o); 从集合中删除对象o
void clear(); 清空集合
boolean isEmpty(); 判断集合中元素个数是否为0
Object[] toArray(); 将集合转换成一维数组
SequencedCollection 接口
- 所有的有序集合都实现了 SequencedCollection 接口。
- SequencedCollection 接口是 JDK21 版本新增的。
SequencedCollection接口中的方法:
void addFirst(Object o):向头部添加
void addLast(Object o):向末尾添加
Object removeFirst():删除头部
Object removeLast():删除末尾
Object getFirst():获取头部节点
Object getLast():获取末尾节点
SequencedCollection reversed(); 反转集合中的元素
ArrayList,LinkedList,Vector,LinkedHashSet,TreeSet,Stack 都可以调用这个接口中的方法。
5、遍历 Collection
- 获取当前集合依赖的迭代器对象
Iterator it = collection.iterator();
- 编写循环,循环条件是:当前光标指向的位置是否存在元素。
while(it.hasNext()){}
- 如果有,将光标指向的当前元素返回,并且将光标向下移动一位。
Object obj = it.next();
6、删除 Collection 元素
使用 remove 方法删除 Collection 元素时:
- 不得使用
集合对象.remove(元素)
。因为可能导致 ConcurrentModificationException 异常。 - 应使用
迭代器对象.remove(元素)
。
本质是潜在的线程冲突。
fail-fast 机制
假设有两个线程:A 和 B。A 线程负责迭代遍历集合,B 线程使用集合对象.remove(元素)
删除集合中的某个元素。
当这两个线程同时执行时,我们无法预知 A 线程遍历的结果。
-
因此,集合框架使用 fail-fast 快速失败机制,避免这种情况发生。
- 只要程序发现了程序对集合进行了并发修改。就会立即让其失败,以防出现错误。
- 该机制在数据量少的时候,可能并不会触发。
-
fail-fast 机制的实现原理
,以上述代码为例- 集合中设置了一个 modCount 属性,用来记录修改次数。
- 迭代器中设置了一个 expectedModCount 属性,用来记录预期的修改次数。当获取一个迭代器对象时,构造器会将迭代器对象中的 expectedModCount 属性初始化为 modCount 的值,即:int expectedModCount = modCount 。
- 使用集合对象执行增\删\改任意一个操作时,modCount 自动加 1。;使用迭代器执行增\删\改任意一个操作时,modCount 和 expectedModCount 同时加1。
- 当任意时刻检测到 modCount != expectedModCount 时,抛出 ConcurrentModificationException 异常。
实例
// 以下程序会抛出 ConcurrentModificationException 异常
ArrayList<String> namesList = new ArrayList<>();
namesList.add("zhangsan");
namesList.add("lisi");
namesList.add("wangwu");
namesList.add("zhaoliu");
Iterator<String> it = namesList.iterator();
while (it.hasNext()) {
String name = it.next();
if ("lisi".equals(name)) {
namesList.remove(name);
}
System.out.println(name);
}
对于以上代码执行的描述:
- 当使用集合对象删除
lisi
时:modCount 加1,但是迭代器 expectedModCount 不会加 1。 - 进入下一轮循环,当迭代器对象的 next() 方法执行时,会检测 expectedModCount 和 modCount 是否相等,如果不相等,则抛出:ConcurrentModificationException 异常,程序终止
// 将删除元素的方式改成用迭代器删除,程序正常运行.
it.remove(); // 使用迭代器的 remove 方法
对于以上代码执行的描述:
- 当使用迭代器删除元素的时候:modCount 和 expectedModCount 同时加1。
- 下一次循环时,当迭代器对象的 next() 方法执行时,检测到 expectedModCount = modCount,则不会出现 ConcurrentModificationException 异常。
注意:虽然我们当前写的程序是单线程的程序,并没有使用多线程,但是通过迭代器去遍历的同时使用集合去删除元素,这个行为将被认定为并发修改。
Map
- Map 保存的是键值对,键要求保持唯一性,值可以重复。
- Map 接口的常见实现类有两个:
- HashMap
- TreeMap
1. HashMap
- HashMap 可以根据
键
快速地查找对应的值——通过哈希函数将键映射到哈希表中的一个索引位置,从而实现快速访问。 - HashMap 中的键和值都可以为 null。如果键为 null,则将该键映射到哈希表的第一个位置。
- 可以使用迭代器或者 forEach 方法遍历 HashMap 中的键值对。
- HashMap 有一个初始容量和一个负载因子。初始容量是指哈希表的初始大小,负载因子是指哈希表在扩容之前可以存储的键值对数量与哈希表大小的比率。默认的初始容量是 16,负载因子是 0.75。
// HashMap 实例
HashMap<String, String> hashMap = new HashMap<>();
// 添加键值对
hashMap.put("苹果", "apple");
hashMap.put("牛油果", "avocado");
hashMap.put("香蕉","Banana");
// 遍历 HashMap
for (String key : hashMap.keySet()) {
String value = hashMap.get(key);
System.out.println(key + " 对应的值为:" + value);
}
// HashMap 中,键的顺序是根据键的哈希码计算结果来决定的,因此,不保证有序
// 输出为 苹果-- 香蕉--牛油果
// 获取指定键的值
String value1 = hashMap.get("苹果");
System.out.println("苹果对应的值为:" + value1);
// 修改键对应的值
hashMap.put("苹果", "apple1");
String value2 = hashMap.get("苹果");
System.out.println("修改后苹果对应的值为:" + value2);
// 删除指定键的键值对
hashMap.remove("牛油果");
2. LinkedHashMap
- LinkedHashMap 是 HashMap 的子类,。也就是说,只要是 LinkedHashMap ,那么必然也是一个 HashMap。
- LinkedHashMap 可以看作是 HashMap + LinkedList 的合体。它使用哈希表来存储数据;使用双向链表来记录插入/访问元素的顺序,维持顺序。
- 这里的顺序,指的是维持插入的顺序。
// LinkedHashMap 实例
LinkedHashMap<String, String> linkedHashMap = new LinkedHashMap<>();
linkedHashMap.put("苹果", "apple");
linkedHashMap.put("牛油果", "avocado");
linkedHashMap.put("香蕉","Banana");
// 遍历 LinkedHashMap
for (String key : linkedHashMap.keySet()) {
String value = linkedHashMap.get(key);
System.out.println(key + " 对应的值为:" + value);
}
// linkedHashMap 保证顺序,输出为 苹果--牛油果--香蕉,可对比 HashMap 的无序
3. TreeMap
- TreeMap 实现了 SortedMap 接口,可以自动将键按照自然顺序或指定的比较器顺序排序,并保证其元素的顺序。
- 内部使用红黑树来实现键的排序和查找。
- 这里的顺序,指的是以键值为依据,按照某种规则排序。
// TreeMap 实例
Map<String, String> treeMap = new TreeMap<>();
// 向 TreeMap 中添加键值对
treeMap.put("c", "cat");
treeMap.put("a", "apple");
treeMap.put("b", "banana");
// 遍历 TreeMap
for (Map.Entry<String, String> entry : treeMap.entrySet()) {
System.out.println(entry.getKey() + ": " + entry.getValue());
}
// 按照默认顺序对键进行了排序,输出是 a--b--c
// 查找键值对
String name = "c";
if (treeMap.containsKey(name)) {
System.out.println("找到了 " + name + ": " + treeMap.get(name));// 输出 c:cat
}
// 修改键值对
name = "a";
if (treeMap.containsKey(name)) {
System.out.println("修改前的 " + name + ": " + treeMap.get(name));// 输出 a:apple
treeMap.put(name, "aovcado");
System.out.println("修改后的 " + name + ": " + treeMap.get(name));// 输出 a:aovcado
}
// 删除键值对
name = "b";
if (treeMap.containsKey(name)) {
System.out.println("删除前的 " + name + ": " + treeMap.get(name));
treeMap.remove(name);
System.out.println("删除后的 " + name + ": " + treeMap.get(name));// 输出 b:null
}
ArrayList
- ArrayList 和 HashMap,算是最常用的两个集合框架实现。
- ArrayList 基于数组实现了 List 接口。
- Java 原生数组的大小是固定的,但 ArrayList 提供了自动扩容,它可以看作“可变长度”的数组,因此用起来比数组更方便。
- 实际上 ArrayList 内部就是一个 Object[] 数组,配合一个变量记录当前分配空间,就可以充当“可变数组”
- 需要频繁的检索元素,并且很少的进行随机增删元素时使用 ArrayList。
Constructor
// 使用无参数构造器创建 ArrayList,并提前指定泛型为 String
ArrayList<String> list = new ArrayList<>();
// 使用无参数构造器创建 ArrayList,将泛型留给调用者确认类型
ArrayList<E> list = new ArrayList<>();
// 尽管会自动扩容,但仍可以使用带有固定容量参数创建 ArrayList
ArrayList<String> list1 = new ArrayList<>(int capacity);
// 使用带有集合参数的构造器创建 ArrayList
ArrayList<Integer> list = new ArrayList<>(Arrays.asList(1, 2, 3, 4, 5));
// 运用多态。由于 ArrayList 实现了 List 接口,所以 list 变量的类型可以是 List 类型
List<String> list = new ArrayList<>();
API
// E,即泛型,即可以传入任何引用类型。
boolean add(E e);// 添加元素到列表末尾
void add(int index, E element);// 在指定位置插入元素
E get(int index);// 获取指定位置的元素
E set(int index, E element);// 修改指定位置的元素
E remove(int index);// 移除指定位置的元素
boolean remove(Object o);// 移除首次出现的指定元素
void clear();// 清空列表
int size();// 获取列表的大小
boolean isEmpty();// 检查列表是否为空
boolean contains(Object o);// 检查列表是否包含某个元素
int indexOf(Object o);// 获取某个元素第一次出现的索引
int lastIndexOf(Object o);// 获取某个元素最后一次出现的索引
boolean addAll(Collection<? extends E> c);// 添加一个集合中的所有元素到列表末尾
boolean addAll(int index, Collection<? extends E> c);// 在指定位置插入一个集合中的所有元素
boolean removeAll(Collection<?> c);// 从列表中移除指定集合中包含的所有元素
boolean retainAll(Collection<?> c);// 仅保留列表中包含在指定集合中的元素
Object[] toArray();// 将列表转换为数组
<T> T[] toArray(T[] a);// 将列表转换为指定类型的数组
Iterator<E> iterator();// 获取列表的迭代器
ListIterator<E> listIterator();// 获取列表的列表迭代器(从开始处)
ListIterator<E> listIterator(int index);// 获取列表的列表迭代器(从指定位置开始)
void sort(Comparator<? super E> c);// 使用自然顺序对列表进行排序
void replaceAll(UnaryOperator<E> operator);// 用新值替换列表中所有旧值
源码解读
add
// 堆栈过程示意:
add(element)
└── if (size == elementData.length) // 判断是否需要扩容。elementData 是实际存储元素的数组。
├── grow(minCapacity) // 扩容
│ └── newCapacity = oldCapacity + (oldCapacity >> 1) // 新数组容量 = 老数组容量 + 老数组容量的一半
│ └── Arrays.copyOf(elementData, newCapacity) // 将老数组
├── elementData[size++] = element; // 添加新元素
└── return true; // 添加成功
add 方法源码如下:
public boolean add(E e) {
ensureCapacityInternal(size + 1); // 确保 ArrayList 能够容纳新的元素
// 在 ArrayList 的末尾添加指定元素。ArrayList 底层就是一个叫 elementData 的数组
elementData[size++] = e; 。
return true;
}
add 方法非常简洁,主要代码被封装于静态方法 ensureCapacityInternal 中。
/**
* 确保 ArrayList 能够容纳指定容量的元素
* @param minCapacity 指定容量的最小值
*/
private void ensureCapacityInternal(int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { // 如果 elementData 还是默认的空数组
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity); // 使用 DEFAULT_CAPACITY 和指定容量的最小值中的较大值
}
ensureExplicitCapacity(minCapacity); // 确保容量能够容纳指定容量的元素
}
ensureExplicitCapacity 方法的作用是:确保 ArrayList 内部数组有足够的容量来存储新添加的元素。如果容量不足,它会增加内部数组的大小。
调用的顺序是:add --> ensureCapacityInternal --> ensureExplicitCapacity,以下分析二者的不同:
- ensureCapacityInternal 用于计算初始容量。在指定容量和默认容量 10 之间取更大者,作为初始容量,然后将这个初始容量参数传入 ensureExplicitCapacity。
- ensureExplicitCapacity 来实际执行容量检查和扩容。当容量不足时,调用 grow 方法进行扩容。