初阶数据结构学习记录——아홉 二叉树和堆(2)

news2024/9/22 5:37:00

接着上一篇

之前写过一些关于堆的代码,向下调整,向上调整算法,以及常用的几个函数。这一篇继续完善堆,难度也会有所上升。先来看上一篇文末提到的创建堆算法。

首先要有空间,要有数据,之后再形成堆。我们可以malloc一块空间,数据也可push或者创建一个数组然后拷贝过来,不过面对一个不成规则的数据如何把他们做成堆?直接用向上或向下调整都不能做到,如果说根节点的整个左子树和右子树都是大堆,那么用向下调整就合适。现在用这串数字做例子

 把它变成堆的样子后,最后一层就有49 25 37。现在要把左右子树都变成大堆,如何改变?我们一块一块来改。37和28、18,49和25、19,34和65,、15和子节点们,最后整体调整。而关于18应该怎么找到,如果数组大小是n,那么18的下标就是(n-1-1)/2,用循环即可一个个调整。

 void HeapCreate(HP* php, HPDataType* a, HPDataType n)
{
    assert(php);
    php->a = (HPDataType*)malloc(sizeof(HPDataType) * n);
    if (php->a == NULL)
    {
        perror("realloc fail");
        exit(-1);
    }
    memcpy(php->a, a, sizeof(HPDataType) * n);
    php->size = php->capacity = n;
    for (int i = (n - 1 - 1) / 2; i >= 0; i--)
    {
        AdjustDown(php->a, n, i);
    }
}

测试一下

 void TestHeap3()
{
    int arr[] = { 27, 15, 19, 18, 28, 34, 65, 49, 25, 37 };
    HP hp;
    HeapCreate(&hp, arr, sizeof(arr) / sizeof(int));
    HeapPrint(&hp);
    HeapDestroy(&hp);
}

 成功创建。

堆排序

现在做排序算法

给一个数组,通过排序算法把他们变成堆。原始的数组无序。

    int arr[] = { 27, 15, 19, 18, 28, 34, 65, 49, 25, 37 };
    HeapSort(arr, sizeof(arr) / sizeof(int));

这样的话我们有两个方案,做向上调整或者向下调整。

    for (int i = 1; i < n; i++)
    {
        AdjustUp(a, i);
    }
    for (int i = (n - 1 - 1) / 2; i >= 0; i--)
    {
        AdjustDown(a, n, i);
    }

向上调整的思路就是默认为大堆,遍历数组看成一个个插入,插入第一个不做操作,第二个开始就进行比较,然后决定是否交换位置

向下调整的思路则是所有数据无序,不能直接进行向下调整。其实这个条件可以从pop函数里看出来,pop操作时,整体是大堆顺序,交换首尾元素,size--,这样整个堆里除了根节点,左子树和右子树都是大堆,这种情况向下调整可行。所以同样,这里就不能直接调整,但从尾开始调整是可以的。找到尾部元素的父节点,一一调整。

但是一般使用向下调整。假设是一个完全二叉树,N为节点数,h是高度。向下调整的次数是2^h -1 -h,也就是N - h,也就是N - log2(N + 1),最后时间复杂度就是O(N)。

而向上调整最后一层的最大调整次数就是2^(h-1) * (h-1),把它变成2^h*(h-1) / 2,也就是(N + 1)(log2N + 1) / 2, 所以仅最后一层都达到了N * log2N,所以向上调整的时间复杂度明显比向下大,而向上调整的时间复杂度就是O(N * log2N)。

在二叉树里,最后一层的节点数最多,而向下调整跳过了最后一层,直接从最后一层的父节点开始调整,并且从下到上,节点数多的调整少,而向上调整则是节点多的调整多,最后一层更是很多调整。所以不管是不是全部都要调整,向下调整次数都明显比向上少。

所以用向下调整法

向下调整选好了,接下来思考另一个问题,如果要升序的话,应该是建立大堆还是小堆?假如现在建小堆,面对一串无序的数字,如果pop掉第一个元素,把它放到另一个空间里,然后一个个插入来调整做成小堆可以,但是这样空间复杂度变高了。但是不开辟空间的话,在原始数组里调整,会发现数字之间的关系很容易乱掉,耗掉了很多时间。所以升序还是建立大堆。

大堆建好后,我们开始做升序。关于升序,我们可以把首尾元素互换一下,这样最大值出现在尾部,然后对于前面的数值进行向下调整找到次大值,排在倒数第二个位置,然后重复这个操作即可。

void AdjustDown(HPDataType* a, int n, int parent)
{
    int child = parent * 2 + 1;
    while (child < n)
    {
        //确认child指向大的那个孩子并且child要小于size
        if (child + 1 < n && a[child + 1] > a[child])
        {
            ++child;
        }
        if (a[child] > a[parent])
        {
            Swap(&a[child], &a[parent]);
            parent = child;
            child = parent * 2 + 1;
        }
        else
        {
            break;
        }
    }
}

void HeapSort(HPDataType* a, HPDataType n)//O(N * log2N)
{
    //0(N)
    for (int i = (n - 1 - 1) / 2; i >= 0; i--)
    {
        AdjustDown(a, n, i);
    }
    int end = n - 1;
    //O(N * log2N)
    while (end > 0)
    {
        Swap(&a[0], &a[end]);
        AdjustDown(a, end, 0);
        end--;
    }
}

当然如果向下调整里a[child + 1] > a[child]以及a[child] > a[parent]都改成<,那么就是降序了。

TOPK问题

接着来下一个问题。

在一些数据中找到十个最大的数据,把这个数字设为k,也就是找到前k个大的数据。当然我们可以一个个比较,但是正因为数据量不确定,所以情况不能这样简单。假设是有N个数字,N为十亿,百亿个,如果还是之前的办法是肯定不可行的。我们现在用堆来解决。堆如何找到最大的那k个数字?如果建立一个大堆,放进所有数字,那么最大的那几个一定是在前面的,这样取堆顶,然后pop掉(pop里面有向下调整),再取堆顶,就能找到前十个了。虽然这个思路可以,但是忘了一个重要的事,还是数据很大的问题。百亿个数字,建立一个百亿数字的大堆,这需要占用多少内存?算下来,几十G。所以,这个方法其实是不现实的。单论这个思路来讲,时间复杂度是N + logN * K,空间复杂度是O(1)。

现在换另一个思路,假设k就是10吧,前10个大的数字集合起来叫做O,用整个数据集里前10个数字作一个小堆,这个小堆都有哪些数字不需要担心,即使有O里面的数字也可,因为它一定大于其它所有的数字,也一定在堆里面靠下点的位置。之后遍历剩下的数字,每个都和现有小堆的堆顶比较,小于就无操作,大于就进堆,如果遇到O里面的数字,假设编号是O1 - O10,无论哪个数字,都一定会进堆,然后放在下面。假如遍历到最后时,才遇到O1或者O10也没有关系,遇到O1会进堆,此时其他数字都进来了,那么排在第一层的就相对来说是一个小数字,进入后不断向下调整,堆顶就会变为O10,最后整个堆就是O里的数字。O10也一样,一定会替换掉堆顶,自己做堆顶。其他哪一个O里的数字都一样。

而这样的时间复杂度是K + (N - K) * logK,空间复杂度为K。这种做法会直接在磁盘里读取数据,空间问题也就解决了。

接下来是代码展示。

先随机1000个数字,范围在10000之内

向下调整改成小堆

a[child + 1]以及a[child]后的 > 改成 <即为小堆。

测试函数

这里数组也可以malloc。

但是这还有一个问题,程序给出的结果就真的是最大的那10个吗?我们应该怎么判定?其实我们可以主动对数据做点动作,改变k个数据,让他们变成毫无疑问的最大。这里我把生成随机数也放进测试函数里。

 

所以最大的几个就出来了。

放出这篇所有代码

创建堆

void HeapCreate(HP* php, HPDataType* a, HPDataType n)
{
    assert(php);
    php->a = (HPDataType*)malloc(sizeof(HPDataType) * n);
    if (php->a == NULL)
    {
        perror("mealloc fail");
        exit(-1);
    }
    memcpy(php->a, a, sizeof(HPDataType) * n);
    php->size = php->capacity = n;
    for (int i = (n - 1 - 1) / 2; i >= 0; i--)
    {
        AdjustDown(php->a, n, i);
    }
}

排序

 void HeapSort(HPDataType* a, HPDataType n)//O(N * log2N)
{
    //0(N)
    for (int i = (n - 1 - 1) / 2; i >= 0; i--)
    {
        AdjustDown(a, n, i);
    }
    int end = n - 1;
    //O(N * log2N)
    while (end > 0)
    {
        Swap(&a[0], &a[end]);
        AdjustDown(a, end, 0);
        end--;
    }
}

Top K

由于网络极致不要脸地无法十分钟传输一张图片,所以这里只能展示改过后的代码,而图片则没有。其实也不算是网络的事,是学校扯淡到极其可笑了。改动位置是随机设置k个超大数那里。

void TestHeap5()
{
    int k, n = 0;
    printf("请输入n和k: >");
    scanf("%d%d", &n, &k);
    srand(time(0));
    int j = 0;
    int i = 0;
    int num = k;
    FILE* fd = fopen("E:\\c start\\data.txt", "a");
    if (fd == NULL)
    {
        perror("fopen fail");
        return;
    }
    for (i = 0; i < n; i++)
    {
        j = rand() % 10000;
        //随机设置k个超大数
        if (num)
        {
            j = num + 100000;
            num--;
        }
        fprintf(fd, "%d\n", j);
    }
    fclose(fd);


    //找Top K
    int* minHeap = malloc(sizeof(int) * k);
    if (minHeap == NULL)
    {
        perror("malloc fail");
        return;
    }
    int m = 0;
    FILE* ft = fopen("E:\\c start\\data.txt", "r");
    if (ft == NULL)
    {
        perror("fopne fail");
        return;
    }
    for (int i = 0; i < k; i++)
    {
        fscanf(ft, "%d", &minHeap[i]);
    }
    for (int i = (k - 1 - 1) / 2; i >= 0; i--)
    {
        AdjustDown(minHeap, k, i);
    }
    while (fscanf(ft, "%d", &m) != EOF)
    {
        if (m > minHeap[0])
        {
            minHeap[0] = m;
            AdjustDown(minHeap, k, 0);
        }
    }
    for (int i = 0; i < k; i++)
    {
        printf("%-8d", minHeap[i]);
    }
    printf("\n");
    fclose(ft);
}

结束。下一篇开始写链式二叉树。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/33061.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

9.5 利用可执行内存挑战DEP

目录 一、实验环境 二、实验思路 三、实验代码 四、实验步骤 1、寻找memcpy函数的地址 2、查看内存中可读可写可执行的内存 3、修复EBP 4、保证memcpy的源地址位于shellcode之前 一、实验环境 操作系统&#xff1a;windows 2000 软件&#xff1a;原版OD、VC6.0 二、实…

删除的数据如何恢复?误删了文件怎么恢复

文件的误删除&#xff0c;相信大部分人都经历过。不过因为很多人删除的文件都不算是很重要&#xff0c;所以有与没有并没有太大的区别。但是一旦你删除的文件正是你最近急需的&#xff0c;删除的数据如何恢复&#xff1f;别着急&#xff0c;可以试试以下的几种方法&#xff1a;…

STM32串口详解

实验一&#xff1a;简单的利用串口接收中断回调函数实现数据的返回 关于串口调试助手&#xff0c;还应知道&#xff1a; 发送英文字符需要用一个字符即8位&#xff0c;发送汉字需要两个字符即16位&#xff0c;如上图&#xff0c;发送汉字“姜”实际是发送“BD AA”而发送英文字…

外卖项目06---套餐管理业务开发(移动端的后台代码编辑开发)

菜品展示、购物车、下单 目录 一、导入用户地址簿相关功能代码 90 1.1需求分析 90 1.2数据模型 90 1.3导入功能代码 90 二、菜品展示 91 2.1需求分析 91 2.2商品展示---代码开发---梳理交互过程 92 2.3菜品展示---代码开发---修改DishController的list方法并测试 93 2…

OpenGL原理与实践——核心模式(二):Shader变量、Shader类的封装以及EBO

目录 Shader内的一些关键字 向量 举例&#xff1a;shader之间的数据传输&#xff0c;并实现渐变颜色 举例&#xff1a;C向shader传输数据的过程 代码整理——shader类的封装 加入颜色信息 索引绘制——EBO 整体代码以及渲染结果 Shader内的一些关键字 in&#xff1a;上…

网站被劫持勒索怎么办

互联网出现后的几十年时间里&#xff0c;世界便由一张张网串联了起来&#xff0c;给我们的生活带来了无限的便利。但在互联网飞速发展的同时&#xff0c;恶意网络攻击也随之而来&#xff0c;近年来&#xff0c;互联网攻击事件频发&#xff0c;不法分子利用常见的DDoS攻击、CC攻…

【生成式网络】入门篇(二):GAN的 代码和结果记录

GAN非常经典&#xff0c;我就不介绍具体原理了&#xff0c;直接上代码。 感兴趣的可以阅读&#xff0c;里面有更多变体。 https://github.com/rasbt/deeplearning-models/tree/master/pytorch_ipynb/gan GAN 在 MINIST上的代码和效果 import os # os.chdir(os.path.dirname(_…

springBoot集成websocket实现消息实时推送提醒

在浏览某些网页的时候&#xff0c;例如 WebQQ、京东在线客服服务、CSDN私信消息等类似的情况下&#xff0c;我们可以在网页上进行在线聊天&#xff0c;或者即时消息的收取与回复&#xff0c;可见&#xff0c;这种功能的需求由来已久&#xff0c;并且应用广泛,和pc端web系统待办…

新建anaconda使用jupyter出现的一系列问题

1&#xff0c;运行一段机器学习代码&#xff0c;报缺少h5py的错误. 使用conda install h5py1.8.0 安装无法安装&#xff0c;因为当前环境的python版本是3.9&#xff0c;只能用3.7及以下的版本。无奈只能新建一个conda 环境。 2&#xff0c;新建一个 python3.7的conda 环境。运行…

「风控算法服务平台」高性能在线推理服务设计与实现

本文作者&#xff1a;郁昌存 来自京东科技-风险管理中心 一、背景/目标 1&#xff09; 风控智能化体系建设依赖大量深度学习/机器学习模型进行实时在线的风险识别、智能决策。要求可以将算法模型快速部署为在线服务&#xff0c;供决策引擎调用。 2&#xff09; 风控决策引擎…

文献 | 教师主观幸福感变迁:横断历史研究的视角

Hello&#xff0c;大家好&#xff01; 这里是壹脑云科研圈&#xff0c;我是莹~ 疫情带来的社会经济变化正在改变着我们的求职意向&#xff0c;越来越多的人参与到考公考编的大军中。其中&#xff0c;教师这一职业的稳定性和社会认同度吸引了越来越多的年轻人参加教资考试。 教…

Linux Top 详细介绍,包含task排序

Linux Top 当我们在终端输入 top 命令时&#xff0c;会弹出一个变化的页面&#xff0c;打印出当前系统的大量重要指标&#xff0c;以及很多进程当前的运行情况&#xff1a; 可以看到&#xff0c;top 命令主要是两部分&#xff0c;第一部分为 头部指标&#xff0c;打印的是当…

磨金石教育摄影技能干货分享|那些酷炫的照片是怎么拍出来的?

在网上我们经常会看到一些非常有创意&#xff0c;非常炫酷的照片。喜欢摄影的朋友肯定会想&#xff0c;这样的照片怎么拍呢&#xff1f;由于照片的创意度很高&#xff0c;导致很多人想模仿却不知道怎么模仿。以前学的那些构图、选景等技巧&#xff0c;好像不太够用。 今天我们…

2022年文化艺术品产权交易所研究报告

第一章 文化艺术品产权交易所发展概述 1.1 文交所概念 文化产权交易所&#xff08;简称“文交所”&#xff09;从事文化产权交易及相关投融资服务工作&#xff0c;促进文化产业要素跨行业、跨地域、跨所有制流动。文交所从事的创新业务主要是文化艺术品的份额化&#xff0c;即…

idea 配置ssm项目后配置文件的简要解析及功能类之间的联系

注&#xff1a;本文不包含怎么配置 idea ssm 项目&#xff0c;仅做个人向配置好之后&#xff0c;对于各个文件的分析及跳转之间的的浅解析&#xff08;之前照着配的文章找不到了qwq&#xff09;。 叠甲&#xff1a;新手&#xff0c;刚学&#xff0c;不太会&#xff0c;如有错请…

初识Python_数据容器_字符串str

一、再识字符串字符串---字符的容器。一个字符串可以存放任意数量的字符1、字符串的下标&#xff08;索引&#xff09;和其他容器如&#xff1a;列表、元组一样&#xff0c;字符串也可以通过下标进行访问从前向后 下标从0开始从后向前&#xff0c;下标从-1开始同元组一样&#…

11个精美网页——Web前端开发技术课程大作业,期末考试,Dreamweaver简单网页制作

HTML实例网页代码, 本实例适合于初学HTML的同学。该实例里面有设置了css的样式设置&#xff0c;有div的样式格局&#xff0c;这个实例比较全面&#xff0c;有助于同学的学习,本文将介绍如何通过从头开始设计个人网站并将其转换为代码的过程来实践设计。 精彩专栏推荐&#x1f4…

罗茨气体流量计的结构设计

目 录 摘 要 I ABSTRACT II 1绪 论 1 1.1 引言 1 1.2 罗茨气体流量计的特点 1 1.&#xff13;罗茨气体流量计的应用场合[3] 2 1.4 发展前景[5] 6 2罗茨气体流量计的工作及结构原理 7 2.1 罗茨气体流量计的工作原理[3] 7 2.2罗茨气体流量计的结构原理 7 2.2.1 罗茨气体流量计的结…

echarts——实现3D地图+3D柱状图 效果——粗糙代码记录——技能提升

最近看到同事在弄下面的这个图&#xff0c;这个图是从网上看到的&#xff0c;是某个网站的收费项目&#xff1a; 收费模板&#xff1a;&#xffe5;29.9元购买&#xff0c;且必须是高级版尊享版才能够购买这个。。。 死贵&#xff01;&#xff01;&#xff01; 所以&#xf…

多臂PEG衍生物——8-Arm PEG-N3,8-Arm PEG-Azide,八臂-PEG-叠氮

多臂PEG衍生物八臂-聚乙二醇-叠氮&#xff0c;化学试剂其英文名为8-Arm PEG-Azide&#xff0c;8-Arm PEG-N3&#xff0c;它所属分类为Azide PEG Multi-arm PEGs。 八臂PEG叠氮的分子量均可定制&#xff0c;有&#xff1a;八臂-peg 5k-叠氮、八臂PEG 2k叠氮、叠氮-聚乙二醇 10k…