前面一节我们都已将堆的结构(顺序存储)已经实现,对树的相关概念以及知识做了一定的了解。其中我们在实现删除操作和插入操作的时候,我们还同时实现了建大堆(小堆)的向上(下)调整算法。
在这里我们需要补充:
我们上一节实现的算法中的向上调整算法的时间复杂度为O(n*log n),而向下调整算的时间复杂度为O(n)。所以我们就可以知道,在建堆的时候尽量选择时间复杂度较小的向下调整算法。
一.堆排序
小Tip:排升序,建大堆;排升序,建小堆。
1.版本一:
基于已有数组进行建堆,取堆顶元素完成排序。
注:该版本有一个前提,必须提供现有的数据结构堆。
//1.需要堆的数据结构 //2.空间复杂度 O(N) void HeapSort(int* a, int n) { HP hp; //创建一个堆 for (int i = 0; i < n; i++) { HPPush(&hp, a[i]); //将数组中每一个元素逐个插入堆中 } //逐个取堆顶的元素 int i = 0; while (!HPEmpty(&hp)) { a[i++] = HPTop(&hp);//取堆顶的元素 HPPop(&hp);//出堆 } //销毁堆 HPDestroy(&hp); }
基于前面我们已经实现过堆的顺序存储结构,在这里我们就只实现局部代码。实现思路我在代码的旁边已经进行了标注。
2.版本二:数组进行建堆,首尾交换,交换之后的堆尾从堆中删除掉,将堆顶数据向下调整选出次大的数据。
void HeapSort(int* a, i int n) { //先进行向下调整算法建堆 for (int i = (n - 1 - 1) / 2; i >= 0; i--) { AdjustDown(arr, i, n); } //循环 将堆顶数据进行交换,交换完将调整堆(堆中的要访问的底层数组的下标减1,在进行堆的调整的时候end还是 要调整的 堆中的元素个数) int end = end - 1; while (end) { Swap(&a[0], &a[end]); AdustDwon(a, 0, end); end--; } }
实现思路已经在上面的代码中已经标注了。
二 .top-k问题
如果我们要在10个数据中,找前面3个最大的数据是多少,咋找? 如果我们要在100个数据中,找前面3个最大的数据是多少,咋找? 如果我们要在1000个数据中,找前面3个最大的数据是多少咋找? ……如果我们要在100000000000000000个数据中,找前面3个最大的数据是多少,咋找呢?
对于数据量少的,我们可以用前面所学的打擂台,冒泡排序,选择法排序,快速排序以及上面所讲的堆排序。但是对于数据量特别大的呢,我们如果还用上面所说的方法,那就太慢太麻烦了。现在我们所玩的游戏(有很多玩家)中找积分最多的前几个玩家?世界人口中找年龄最大的人?……用上面的方法是不是就很繁琐了。
所以对于这种类似的问题结合堆的性质我们就Top-k来进行排序。Top-k问题:即就是求数据集合中前k个最大或者最小的元素,一般情况下数据量都比较大。
#include <stdio.h>
#include <stdlib.h>
void Swap(int* x, int * y)
{
int temp = *x;
*x = *y;
*y = temp;
}//可不用,见后面
void AdjustDown(int* arr, int parent, int size)
{
int child = parent * 2 + 1;//左孩子
while (child < size) //注意这里的条件
{
//找左右孩子中值最小的 小堆用> 大堆用<
if (child + 1 < size && arr[child] > arr[child + 1])
{
child++;
}
//小堆用< 大堆用>
if (arr[child] < arr[parent])
{
Swap(&arr[child], &arr[parent]);
parent = child;
child = parent * 2 + 1;
}
else
{
break;
}
}
}
//top-K 问题 求最大
void topk()
{
int k = 0;
printf("请你输入K>:");
scanf("%d", &k);
//以只读的方式打开文件
const char *file = "data.txt";
FILE* fout = fopen(file, "r");
if (fout == NULL)
{
perror("fopen fail!");
exit(1);
}
//用动态内存内存的知识,申请k个整形单位的数组
int* minHeap = (int*)malloc(sizeof(int) * k);
if (minHeap == NULL)
{
perror("malloc fail!");
exit(2);
}
//从文件中读取数据
for (int i = 0; i < k; i++)
{
fscanf(fout, "%d", &minHeap[i]);
}
//取随机生成前k个数字进行建堆 利用向下调整算法进行建堆
for (int i = (k-1-1)/2; i >= 0; i--)
{
AdjustDown(minHeap, i, k); //建小堆
}
//将文件中剩余的数字和堆中的k个数据进行逐个比较,大的数字王进走,小的数字往出走
int x = 0;
while (fscanf(fout, "%d", &x)!=EOF)
{
//如果此时读取到的数据大于堆顶数据,就将
if (x > minHeap[0])
{
minHeap[0] = x; //此处也可以用Swap函数进行数据的交换
AdjustDown(minHeap, 0, k);
}
}
for (int i = 0; i < k; i++)
{
printf("%d ", minHeap[i]);
}
fclose(fout);
}
//先生成随机数字放在文件中
void CreatData()
{
int n = 100000;
srand((unsigned int)time(NULL));//利用时间戳进行堆随机数种子进行改变
//以写的形式创建文件
const char *file = "data.txt";
FILE* fin = fopen(file, "w");
if (fin == NULL)
{
perror("fin fail!");
return;
}
//向文件中写入用fprintf,向文件中写入数字
for (int i = 0; i < n; i++)
{
int x = (rand() + i) % 1000000;
fprintf(fin, "%d\n", x);
}
fclose(fin);
}
int main()
{
CreatData();
topk();
return 0;
}
实现的思路:
先实现自定义数据交换函数,向下调整算法(时间复杂度低,所以选择它),生成随机数的函数。
其次就是实现Top-K问题的核心了,先定义可以自定可在所有数字要找最大的k个数字的变量k,然后再以读的形式打开所生成随机数的那个文件,再就是开辟k个数据大小的数组空间。
然后先将文件中前k个数据存储在该数组中,再进行将数组中的k个元素进行建堆处理(此处建的是小堆)。随后循环读取文件中剩余的数据(直到遇到文件结束的标志),每一次将从文件中读取中的数据和小堆的堆顶进行比较大小,如果比堆顶数据大就将该值堆顶位置(或者交换)。于此同时之后每次还得数据调整(一直保持小堆)。读取完比较调整完之后,将最终数组中的数据打印在终端上。最终需要关闭文件哦!!!
注:
对于Top-k 问题如果求前K个最大的数据,就建小堆,反之就建小堆。
》》 》》》》》》》》》 今天分享的内容就结束了,下篇见》》》》》》》》》》》》》》》