前面介绍过队列,队列是一种先进先出(FIFO)的数据结构,但有些情况下,操作的数据可能带有优先级,一般出队列时,可能需要优先级高的元素先出队列,该中场景下,使用队列显然不合适,比如:在手机上玩游戏的时候,如果有来电,那么系统应该优先处理打进来的电话;初中那会班主任排座位时可能会让成绩好的同学先挑座位。在这种情况下,数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。 JDK1.8中的PriorityQueue底层使用了堆这种数据结构,而堆实际就是在完全二叉树的基础上进行了一些调整!
堆的概念!
如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为 小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。
堆的性质!
堆中某个节点的值,总是不大于或者不小于其父节点
堆总是一颗完全二叉树
小根堆(最小堆)
大根堆(最大堆)
从堆的概念,我们可以知道,堆是一颗完全二叉树,因此可以层序的规则,采用顺序的方式来高校存储!!
接下来,我们来思考一下:对于集合{27,15,19,18,28,34,65,49,25,37}中的数据,如何将其创建成堆呢??请看笔者接下来的代码:
public class TestHeap {
public int[] elem;
public int usedSize;
public TestHeap(){
this.elem=new int[10];
}
public void initElem(int[] array){
for (int i = 0; i < array.length; i++) {
elem[i]=array[i];
usedSize++;
}
}
public void createHeap(){
for (int parent=(usedSize-1-1)/2;parent>=0;parent--){
shiftDown(parent,usedSize);
}
}
//通过向下调整的方式建立大根堆
private void shiftDown(int parent,int len){
int child=2*parent+1;
//最起码要有左孩子
while (child<len){
//一定有左孩子的情况下
if (child<len&&elem[child]<elem[child+1]){
child++;
}
//child下标一定是左右孩子最大值的下标
if (elem[child]>elem[parent]){
int tmp=elem[child];
elem[child]=elem[parent];
elem[parent]=tmp;
parent=child;
child=2*parent+1;
}else {
break;
}
}
}
}
那么,有了上述的方法,我们在main 方法中,有着:
public static void main(String[] args) {
TestHeap testHeap=new TestHeap();
int[] array={27,15,19,18,28,34,65,49,25,37};
testHeap.initElem(array);
testHeap.createHeap();
}
对于上述代码,若有不懂得,调试即可!!
另外,上述代码,最后建立的是大根堆!!若是想要建立小根堆,则改改代码即可(大于小于号的更改)
有了上述的基础,那么我们可以来根深入的了解一下:堆的插入!!
堆的插入!
在进行堆的插入之前,我们肯定会有一个堆,假设,我们已经有了一个堆,并且还是大根堆!!
当我们想要插入80,则放到当前这棵树的最后位置!!
放到最后位置处,我们还要再次调整为大根堆(向上调整)
通过比较当前插入的数据与根节点的大小,若比根节点大,则进行交换,然后在接着与根节点进行比较!!一直到小于根节点或者没有可比较的元素的时候停止!
在这里,我们主要进行的是:插入元素(向上调整)
public void offer(int val){
if (isFull()){
elem= Arrays.copyOf(elem,2*elem.length);
//扩容
}
elem[usedSize++]=val;
shiftUp(usedSize-1);
}
public boolean isFull(){
return usedSize== elem.length;
}
private void shiftUp(int child){
int parent=(child-1)/2;
while (child>0){
if (elem[child]>elem[parent]){
int tmp=elem[child];
elem[child]=elem[parent];
elem[parent]=tmp;
child=parent;
parent=(child-1)/2;
}else {
break;
}
}
}
经过上述的代码,我们可以看出:堆的插入总共需要两个步骤:
先将元素放入到底层空间中(注意:空间不够时需要扩容)
将最后新插入的节点向上调整,直到满足堆的性质
接下来,我们进入:堆的删除环节!
堆的删除!
注意:堆的删除一定删除的是堆顶元素。具体如下: 1. 将堆顶元素对堆中最后一个元素交换 2. 将堆中有效数据个数减少一个 3. 对堆顶元素进行向下调整
public void pop(){
if (isEmpty()){
return;
}
swap(elem,0,usedSize-1);
usedSize--;
shiftDown(0,usedSize);
}
public boolean isEmpty(){
return usedSize==0;
}
private void swap(int[] array,int i,int j){
int tmp=array[i];
array[i]=array[j];
array[j]=tmp;
}
//通过向下调整的方式建立大根堆
private void shiftDown(int parent,int len){
int child=2*parent+1;
//最起码要有左孩子
while (child<len){
//一定有左孩子的情况下
if (child<len&&elem[child]<elem[child+1]){
child++;
}
//child下标一定是左右孩子最大值的下标
if (elem[child]>elem[parent]){
int tmp=elem[child];
elem[child]=elem[parent];
elem[parent]=tmp;
parent=child;
child=2*parent+1;
}else {
break;
}
}
}
上述便是对于堆的所有代码,经过上面,我们也可以看出来:堆是建立在二叉树的基础上的!!所有,如果没有较好的二叉树基础,那么堆也是……白瞎!跟笔者这个小菜鸡一样!!
下面,我们来做几个练习题,巩固一下吧!!
面试题 17.14. 最小K个数
设计一个算法,找出数组中最小的k个数。以任意顺序返回这k个数均可。
示例:
输入: arr = [1,3,5,7,2,4,6,8], k = 4
输出: [1,2,3,4]
提示:
0 <= len(arr) <= 100000
0 <= k <= min(100000, len(arr))
经过前面内容的讲解,那么, 对于该题,想必能够迎刃而解了吧!!那么。接下来,请看笔者的代码吧:
public int[] smallestk(int[] array,int k){
int[] ret= new int[k];
if (array==null || k==0){
return ret;
}
//建立小根堆
Queue<Integer> minHeap =new PriorityQueue<>(array.length);
for (int x: array) {
minHeap.offer(x);
}
for (int i = 0; i < k; i++) {
ret[i]=minHeap.poll();
//每次从小根堆中弹出一个元素,并且把这个元素放到ret[i]中
}
return ret;
}
对于这个题目,其实难点还是在于思路!!
求最小K个数,我们需要建立大根堆!!将数据的前K个数,建立大根堆(堆顶元素是最大的元素),当遍历第K+1个元素时候,若小于堆顶元素,说明此时堆顶元素,一定不是前K个最小值,则进行交换!!
对于这些数据而言:27 15 19 18 28,根据前3个数据,建立大根堆:
但是,由于第4个元素,18比27小,所以,需要发生替换!!
前K个最大元素——建立小根堆!
小根堆中前K个最大的值,堆顶元素是这K个最大值里面最小的!当遍历到数组元素大于堆顶的时候,说明,此时堆顶的元素一定不是前K个最大的值!
那么,接下来,请看笔者的代码:
//前K个最大的元素
public static int[] maxK(int[] arr,int k){
int[] ret=new int[k];
if (arr==null || k==0){
return ret;
}
Queue<Integer> minHeap=new PriorityQueue<>(k);
//遍历数组的前K个,放到堆当中
for (int i = 0; i < k; i++) {
minHeap.offer(arr[i]);
//忘最小堆中放入前K个元素
}
//遍历剩下的K-1个元素,每次和堆顶的元素进行比较
//堆顶元素小的时候,堆出堆
for (int i = 0; i < arr.length; i++) {
int val=minHeap.peek();
if (val<arr[i]){
minHeap.poll();//出队列
minHeap.offer(arr[i]);//把另一个元素放到堆里面
}
}
for (int i = 0; i < k; i++) {
ret[i]=minHeap.poll();
}
return ret;
}
Top-k问题
TOP-K问题:即求数据集合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。 对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都 不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下: 1. 用数据集合中前K个元素来建堆 前k个最大的元素,则建小堆 前k个最小的元素,则建大堆 2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素 将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。
对于27,15,19,28,18,34,65,49,25,37这些数据而言,从小到大排序,那么,建立小根堆还是大根堆合适??要求对数组本身进行排序!!(显而易见的是大根堆合适)
小根堆的根节点是最小的,但是无法确定左右两个节点的大小,大根堆的做法是:先把数组变成一个大根堆,其次,再将0号下标元素与最后一个待排序的元素进行交换,然后在变为大根堆,此时最大的一个元素就在最后位置……以此类推,这就是堆排序!!