一般情况下, 我们使用队列是为了能够建造队列的先进先出 (First-In-First-Out) 模式的, 达到一种资源的公平分配, 先到达的任务 (元素) 先处理, 但有时需要在队列中基于优先级处理对象。
存入队列中的任务 (元素) 具有优先级, 需要根据优先级修复里面的数据。而在 JDK 1.5 引入的 PriorityQueue, 就具备了这种功能。
1 PriorityQueue 的实现数据结构
PriorityQueue 通过二叉小顶堆实现, 具备下面的特点:
- 二叉堆就是完全二叉树, 左边最多比右边深 1 层, 不能是右边比左边深, 这是和平衡二叉树不同的地方。在树中的数据变动了 (新增/删除等), 具备自行调整的特性。
- 小顶堆: 根节点最小, 父结点的键值总是小于或等于任何一个子节点的键值 (大顶堆, 则是相反的)。
基于上面的 2 个特性, 可以推导出几个特点 (假设当前有一个节点 Node, 从上往下, 从左往右计算, 他是 index 个)
- Node 节点的左子节点的位置为 2 * index + 1
- Node 节点的右子节点的位置为 2 * index + 2
- Node 节点的父级节点的位置为 (index - 1) / 2
每个节点可以推导出其相关的父子级节点, 所以二叉小顶堆可以通过数组优雅的实现。
如图:
2 PriorityQueue 中的几比较重要的属性
public class PriorityQueue<E> {
transient Object[] queue;
private int size = 0;
private final Comparator<? super E> comparator;
transient int modCount = 0;
}
2.1 queue
PriorityQueue 中数据存储的地方, 可以看到是通过数组实现, 通过数组实现了二叉小顶堆的结构。
2.2 size
当前 PriorityQueue 中存储的数据量
2.3 comparator
用户自定义的比较器, PriorityQueue 就是借助这个比较器, 对存入的数据进行比较, 决定优先级的。
如果用户没有定义这个比较器的话, 那么需要保证存入 PriorityQueue 中的数据是可以比较的, 即实现了 Comparator 接口。
而当用户既定义了比较器, 同时数据实现了 Comparator 接口, 优先使用比较器进行比较。
2.4 modCount
当前的 PriorityQueue 变更了多少次。
3 PriorityQueue 的构造方法
public class PriorityQueue<E> {
// 构造函数 1: 无参构造函数
public PriorityQueue() {
// 省略
}
// 构造函数 2: 指定容量的构造函数
public PriorityQueue(int initialCapacity) {
// 省略
}
// 构造函数 3: 指定容量比较器的构造函数
public PriorityQueue(Comparator<? super E> comparator) {
// 省略
}
// 构造函数 4: 指定了初始容量和比较器的构造函数
public PriorityQueue(int initialCapacity, Comparator<? super E> comparator) {
// 省略
}
// 构造函数 5: 指定一个 PriorityQueue 的构造函数
public PriorityQueue(PriorityQueue<? extends E> c) {
// 省略
this.comparator = (Comparator<? super E>) c.comparator();
initFromPriorityQueue(c);
}
// 构造函数 6: 指定一个 SortedSet 的构造函数
public PriorityQueue(SortedSet<? extends E> c) {
this.comparator = (Comparator<? super E>) c.comparator();
initElementsFromCollection(c);
}
// 构造函数 7: 给定一个 Collection 的构造函数
public PriorityQueue(Collection<? extends E> c) {
// 省略
}
}
总共提供了 7 个构造函数, 看起来很多, 实际后面很多都是相同的, 所以需要深入理解的就 1 个, 指定 Collection 的构造函数。
3.1 无参构造函数
public PriorityQueue() {
// 内部调用到自身 2 个参数的构造函数
// 同时提供默认值, 初始容量的默认值为 DEFAULT_INITIAL_CAPACITY = 11, Comparator 比较器为null
this(DEFAULT_INITIAL_CAPACITY, null);
}
3.2 指定容量的构造函数
public PriorityQueue(int initialCapacity) {
// 同样是内部调用到自身的 2 个参数的构造函数
// 初始容量默认值为用户定义的值, Comparator 比较器则为 null
this(initialCapacity, null);
}
3.3 指定容量比较器的构造函数
public PriorityQueue(Comparator<? super E> comparator) {
// 同样是内部调用到了自身的 2 个参数的构造函数
// 初始容量默认为 11, 比较器为用户自定义的
this(DEFAULT_INITIAL_CAPACITY, comparator);
}
3.4 指定了初始容量和比较器的构造函数
public PriorityQueue(int initialCapacity, Comparator<? super E> comparator) {
// 初始容量必须大于 1
if (initialCapacity < 1)
throw new IllegalArgumentException();
// 声明数组
this.queue = new Object[initialCapacity];
// 将用户声明的比较器赋值给自身的比较器属性
this.comparator = comparator;
}
3.5 指定一个 PriorityQueue 的构造函数
public PriorityQueue(PriorityQueue<? extends E> c) {
// 获取队列里面的比较器
this.comparator = (Comparator<? super E>) c.comparator();
// 将队列里面的数据读取到自身, 下面集合构造函数分析
initFromPriorityQueue(c);
}
3.6 指定一个 SortedSet 的构造函数
public PriorityQueue(SortedSet<? extends E> c) {
// 获取 SortedSet 里面的比较器
this.comparator = (Comparator<? super E>) c.comparator();
// 从集合里面读取数据到自身, 同样下面的集合构造函数有分析
initElementsFromCollection(c);
}
3.7 给定一个 Collection 的构造函数
public PriorityQueue(Collection<? extends E> c) {
if (c instanceof SortedSet<?>) {
// SortedSet 内部也是有序的, 实现逻辑也是和 PriorityQueue 一样, 所以特殊处理
SortedSet<? extends E> ss = (SortedSet<? extends E>) c;
// 获取 SortedSet 中的比较器
this.comparator = (Comparator<? super E>) ss.comparator();
// 从 Collection 中获取数据赋值到当前的 PriorityQueue
initElementsFromCollection(ss);
} else if (c instanceof PriorityQueue<?>) {
// PriorityQueue 转为 PriorityQueue, 逻辑简单很多, 所以特殊处理
PriorityQueue<? extends E> pq = (PriorityQueue<? extends E>) c;
// 获取 PriorityQueue 的比较器
this.comparator = (Comparator<? super E>) pq.comparator();
// 获取数据
initFromPriorityQueue(pq);
} else {
// 设置当前的 PriorityQueue 的比较器为 null
this.comparator = null;
// 获取数据
initFromCollection(c);
}
}
/**
* 场景一: 从有序的结合中获取数据
*/
private void initElementsFromCollection(Collection<? extends E> c) {
// 调用这个方法的调用方, Colleciont 是已经有序的
// 转换数组
Object[] a = c.toArray();
// 不是 ArrayList 类型, 通过 Arrays.copyOf 做一层转换
if (c.getClass() != ArrayList.class)
a = Arrays.copyOf(a, a.length, Object[].class);
int len = a.length;
// 只有 1 个元素 或者 自定义的比较器不为 null
if (len == 1 || this.comparator != null)
// 不能为 null
for (int i = 0; i < len; i++)
if (a[i] == null)
throw new NullPointerException();
// 赋值给自身的 queue 数组
this.queue = a;
// 当前的个数等于数组的长度
this.size = a.length;
}
/**
* 场景二: 从 PriorityQueue 中获取数据
*/
private void initFromPriorityQueue(PriorityQueue<? extends E> c) {
// 是 PriorityQueue 直接赋值
if (c.getClass() == PriorityQueue.class) {
this.queue = c.toArray();
this.size = c.size();
} else {
initFromCollection(c);
}
}
/**
* 场景三: 从普通的集合中获取数据
*/
private void initFromCollection(Collection<? extends E> c) {
// 调用这个方法的调用方, Collection 不一定是有序的, 所以为了满足二叉小顶堆的特点, 需要进行堆化调整
// 把 Collection c 中的数据赋值给当前的 Queue
initElementsFromCollection(c);
// 堆化, 数组调整, 使其满足二叉小顶堆的特点
heapify();
}
private void heapify() {
// 对于一个杂乱无章的数组, 进行调整的话, 如果直接从第一个元素开始调整, 那么会频繁的调整
// 通过分析可以知道, 二叉树没有叶子节点占整棵树节点的一半, 所有的叶子节点暂时不看他们的父级节点, 可以看做是已经满足二叉树的节点
// 这一部分看做是满足条件的话, 那么就可以从最后一个有叶子节点的开始往前进行调整, 这样的话, 可以只对数组中的一半进行调整
// 从数组的中间开始调整
for (int i = (size >>> 1) - 1; i >= 0; i--)
// 下移操作, 后面讲解
siftDown(i, (E) queue[i]);
}
4 PriorityQueue 的操作方法
4.1 添加数据
二叉小顶堆的特点
- 父结点的键值总是小于或等于任何一个子节点的键值
- 于数组实现的二叉堆, 对于数组中任意位置的 n 上元素, 其左孩子在 2n+1 位置上, 右孩子 2(n+1) 位置, 它的父亲则在 n-1/2 上, 根节点在 0 位置
为了维护这个特点, 二叉堆在添加元素的时候, 需要一个 “上移” 的动作, “上移” 的过程, 如图:
- 将元素 2 添加在最后一个位置
- 由于 2 比其父亲 6 要小, 所以将元素 2 上移, 交换 2 和 6 的位置
- 然后由于 2 比 5 小, 继续将 2 上移, 交换 2 和 5 的位置
- 此时 2 大于其父亲 (根节点) 1, 结束
上移的过程总结
- 先把需要新增的节点放到末尾的位置
- 和其父级进行比较
2.1 如果没有父节点了, 结束, 当前的位置就是新增节点的位置
2.1 如果比父级的值大, 结束, 这个位置就是新增的节点的所在位置
2.2 如果比父级的值小, 和父级交互值, 然后回到第二步, 继续进行比较
代码实现:
public class PriorityQueue<E> {
public boolean add(E e) {
// 默认添加到尾部, 调用自身的 offer 方法
return offer(e);
}
public boolean offer(E e) {
// 不支持 null
if (e == null)
throw new NullPointerException();
// 修改次数 +1
modCount++;
// 当前数据的个数
int i = size;
// 数据的个数大于当前数组的长度
if (i >= queue.length)
// 扩容
grow(i + 1);
// 已存储数据个数 + 1
size = i + 1;
// 当前数组中的没有数据
if (i == 0)
// 直接把数组的第一位设置为添加的数据
queue[0] = e;
else
// 添加数据到数组的 i 位置并进行上移操作
siftUp(i, e);
return true;
}
// 元素上移
private void siftUp(int k, E x) {
if (comparator != null)
// 有比较器的使用比较器的上移方法
siftUpUsingComparator(k, x);
else
// 没有比较器使用, 没有比较器的的上移方法
siftUpComparable(k, x);
}
// 使用用户自定义的比较器进行比较, 然后完成元素上移操作
private void siftUpUsingComparator(int k, E x) {
while (k > 0) {
// 获取插入位置的父级节点的位置
int parent = (k - 1) >>> 1;
// 获取父级节点的值
Object e = queue[parent];
// 使用比较器进行比较当前的值和父级的值,
// 当前的值 >= 父级的值, 不需要上移了, 此时的 k 位置就是数据存储的位置
if (comparator.compare(x, (E) e) >= 0)
break;
// 当前的位置设置为父级的值
queue[k] = e;
// 将父级的位置赋给当前的 k, 标识下次计划插入的位置, 也就是上移操作
k = parent;
}
// 数组当前的 k 位置等于需要插入的数据 x
queue[k] = x;
}
// 使用元素的比较器进行比较, 然后完成元素上移操作
private void siftUpComparable(int k, E x) {
// 没有比较器, 需要当前的数据是 Comparable 的实现类, 即数据类型是可比较的
Comparable<? super E> key = (Comparable<? super E>) x;
// 大体的流程和上面的一样
while (k > 0) {
int parent = (k - 1) >>> 1;
Object e = queue[parent];
if (key.compareTo((E) e) >= 0)
break;
queue[k] = e;
k = parent;
}
queue[k] = key;
}
// 数组扩容
private void grow(int minCapacity) {
// 当前数组的容量
int oldCapacity = queue.length;
// 当前数组的容量 < 64, 则新的数组容量 = 旧数组容量 * 2 + 2, 否则等于新的数组容量 = 旧的容量 * 1.5
int newCapacity = oldCapacity + ((oldCapacity < 64) ? (oldCapacity + 2) : (oldCapacity >> 1));
// 新的容量比最大值 (int 的最大值 - 8) 大
if (newCapacity - MAX_ARRAY_SIZE > 0)
// 控制新的最大值不大于 int 的最大值
newCapacity = hugeCapacity(minCapacity);
// 声明新的数组, 同时将旧的数组的数据迁移到新的数组
queue = Arrays.copyOf(queue, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
// 小于 0, 抛异常
if (minCapacity < 0)
throw new OutOfMemoryError();
// 入参的容量大于 int 的最大值 - 8 的话, 返回 int 的最大值, 否则返回 int 的最大值 - 8
return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE;
}
}
4.2 删除数据
对于 PriorityQueue 删除数据都是删除根元素, 也就是最小的元素。
删除了根元素, 就要找一个替代者移动到根位置, 相对于被删除的元素来说就是 “下移”, 如图:
- 将找出队尾的元素 8, 并将它在队尾位置上删除
- 此时队尾元素 8 比根元素 1 的最小孩子 3 要大, 所以将元素 1 下移, 交换 1 和 3 的位置
- 然后此时队尾元素 8 比元素 1 的最小孩子 4 要大, 继续将 1 下移, 交换 1 和 4 的位置
- 然后此时根元素 8 比元素 1 的最小孩子 9 要小, 不需要下移, 直接将根元素 8 赋值给此时元素 1 的位置, 1 被覆盖则相当于删除
下移的过程总结
- 获取末尾节点的值, 然后进行删除
- 找到需要删除位置的左右节点, 找到 2 个节点值比较小的节点
2.1 如果没有左右节点, 把末尾节点的值放到这个位置, 下移过程结束
2.2 如果只有左节点, 较小值等于左节点的值
- 用末尾的值和找到的较小值比较
3.1 如果末尾的值比较小值小, 那么需要删除位置放入末尾节点的值, 下移结束
3.2 如果末尾的值比较小值大, 那么把较小值的放到需要删除的位置, 需要删除的位置替换为较小值所在的位置, 然后回到第二步, 继续进行比较
如果删除的位置刚好是根节点, 上面的下移基本完成了。
如果删除的位置是中间的位置, 那么还需要在进行一次是否上移的判断:
如果末尾的值直接就是放入第一次需要删除的位置, 没有任何的比较替换操作, 这是放入的位置的值可能比他的父级小, 所以还需要进行一次上移的判断,
如果不是直接放入到第一次需要删除的位置, 就不需要进行上移的判断
代码实现:
public class PriorityQueue<E> {
public E remove() {
E x = poll();
if (x != null)
return x;
else
// 为 null 抛出异常
throw new NoSuchElementException();
}
public E poll() {
// 存储的数据个数为 0, 返回 null
if (size == 0)
return null;
// 新的元素个数 = 旧的元素个数 - 1
int s = --size;
// 修改次数 + 1
modCount++;
// 获取根节点
E result = (E) queue[0];
// 获取最后一个节点
E x = (E) queue[s];
// 设置最后一个节点为 null
queue[s] = null;
// 新的元素个数不等于 0, 进行下移
if (s != 0)
siftDown(0, x);
return result;
}
private void siftDown(int k, E x) {
// 将元素 x 放入到 k 的位置, 然后进行下移
if (comparator != null)
siftDownUsingComparator(k, x);
else
siftDownComparable(k, x);
}
// 使用用户自定义的比较器进行比较, 然后完成元素下移操作
private void siftDownUsingComparator(int k, E x) {
// 通过 size/2 找到第一个没有叶子节点的元素, 这个位置后面的节点都是没有叶子节点, 可以不用处理了
int half = size >>> 1;
while (k < half) {
// 获取指定位置的左节点
int child = (k << 1) + 1;
// c 存储的是左右节点中较小的值
Object c = queue[child];
// 右节点的位置
int right = child + 1;
// 不是数组的尾部, 左节点比右节点的值大, 那么较小值 c = 右节点的值
if (right < size && comparator.compare((E) c, (E) queue[right]) > 0)
// 需要替换的值为右节点的值
c = queue[child = right];
// 需要替换的值比左右节点中的较小值还要小, 不需要继续处理了
if (comparator.compare(x, (E) c) <= 0)
break;
// 将 x 理论存储的位置从 k 下移到左右节点中较小的节点的位置 child, 进入下层循环
queue[k] = c;
k = child;
}
// 将 x 值放到 k 位置
queue[k] = x;
}
// 使用元素的的比较器进行比较, 然后完成元素上移操作
private void siftDownComparable(int k, E x) {
// 和上面的逻辑差不多
Comparable<? super E> key = (Comparable<? super E>)x;
int half = size >>> 1;
while (k < half) {
int child = (k << 1) + 1;
Object c = queue[child];
int right = child + 1;
if (right < size && ((Comparable<? super E>) c).compareTo((E) queue[right]) > 0)
c = queue[child = right];
if (key.compareTo((E) c) <= 0)
break;
queue[k] = c;
k = child;
}
queue[k] = key;
}
}
队列基本的操作只有入队和出队, 几乎没有查询的操作, 所以 PriorityQueue 的代码分析就到这里。
5 使用场景
ProfityQueue 在一些调度和算法中使用比较多
- 带有优先级任务的调度, 比如什么加急审批
- 负载均衡, 可以根据流量等因素进行优先级的调度
- 一些搜索算法
6 参考
PriorityQueue源码分析