【LeetCode】692. 前K个高频单词

news2024/11/27 22:38:58

692. 前K个高频单词

  • 描述
  • 示例
  • 解题思路及事项
    • 思路一
    • 思路二

描述

给定一个单词列表 words 和一个整数 k ,返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序

示例

示例1

输入: words = [“i”, “love”, “leetcode”, “i”, “love”, “coding”], k = 2
输出: [“i”, “love”]
解析: “i” 和 “love” 为出现次数最多的两个单词,均为2次。
注意,按字母顺序 “i” 在 “love” 之前。

示例2
输入: [“the”, “day”, “is”, “sunny”, “the”, “the”, “the”, “sunny”, “is”, “is”], k = 4
输出: [“the”, “is”, “sunny”, “day”]
解析: “the”, “is”, “sunny” 和 “day” 是出现次数最多的四个单词,出现次数依次为 4, 3, 2 和 1 次。

解题思路及事项

思路一

遇到这样的题,我们一般思路肯定就是TOP-K问题,这样想当然没有问题,但是我们这里数据没那么多,用到这里属于杀鸡焉用牛刀,不过我们可以试一试,等下在讲别的思路。

不管是那个思路,首先这是一对一的关系,我们肯定要先用到map,,统计不同字符串出现的次数。

TOP-K在于建大堆和小堆的问题,这道题建议建大堆。我们现在已经学了,C++,因此可以使用priority_queue它默认就是建大堆,
在这里插入图片描述
然后把前K个元素拿出来就好了

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string,int> mp;
        for(auto& str:words)
        {
            mp[str]++;
        }

        vector<string> ret;
        //这里我们建一个大堆
        priority_queue<pair<string,int>>> py;
        auto it=mp.begin();
        while(it != mp.end())
        {
            py.push(*it);
            ++it;
        }

        while(k--)
        {
            ret.push_back(py.top().first);
            py.pop();
        }

        return ret;
    }
};

这是根据我们的思路写出来的代码
在这里插入图片描述
但是结果不对,难道我们思路出现了问题,这道题不应该这样解,
其实并不是,这样的思路是对的,但是问题就在于priority_queue第三个参数仿函数的比较出现了问题。
因为它比较的是pair对象。而pair的相关比较函数我们可以看看到底是怎么比的
在这里插入图片描述
可以看到pair是先比较first,如果first相等在比较second。
但是我们的pair第一个参数是string,第二个参数是int。
这于我们想要优先比较int就不对,因此我们自己写一个仿函数。

class Solution {
public:

    template<class T>
    struct Less
    {
        bool operator()(const pair<string,int>& l,const pair<string,int>& r)
        {
            return l.second < r.second;
        }
    };

    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string,int> mp;
        for(auto& str:words)
        {
            mp[str]++;
        }

        vector<string> ret;
        //这里我们建一个大堆
        priority_queue<pair<string,int>,vector<pair<string,int>>,Less<pair<string,int>>> py;
        auto it=mp.begin();
        while(it != mp.end())
        {
            py.push(*it);
            ++it;
        }

        while(k--)
        {
            ret.push_back(py.top().first);
            py.pop();
        }

        return ret;


    }
};

在这里插入图片描述
运行结果还是出现了问题。经过分析可能是建大堆出现了问题,我们打印一下看看是不是这个问题。
在这里插入图片描述
经过对比发现,它们出现次数都是6次,就是建立大堆谁在上面谁在下面出现了问题。

注意看到我们的题目要求,不同单词出现相同频率,按 字典顺序 排序
在这里插入图片描述
而我们在写自己的仿函数的时候,只考虑了出现次数不同的情况,而没有考虑这个情况。

class Solution {
public:

    template<class T>
    struct Less
    {
        bool operator()(const pair<string,int>& l,const pair<string,int>& r)
        {
        //出现次数相同,就按 字典顺序 排序
            return l.second < r.second || (l.second == r.second && l.first > r.first);
        }
    };

    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string,int> mp;
        for(auto& str:words)
        {
            mp[str]++;
        }


        // for(auto& e: mp)
        // {
        //     cout<<e.first<<":"<<e.second<<endl;
        // }
        vector<string> ret;
        //这里我们建一个大堆
        priority_queue<pair<string,int>,vector<pair<string,int>>,Less<pair<string,int>>> py;
        auto it=mp.begin();
        while(it != mp.end())
        {
            py.push(*it);
            ++it;
        }

        while(k--)
        {
            ret.push_back(py.top().first);
            py.pop();
        }

        return ret;       
    }
};

思路二

刚才说过使用堆来对少的数据排序,杀鸡焉用牛刀了。现在想一想我用map建立一对一的关系之后,我给它排序一下不就好了吗,反正有算法库给我提供的sort函数。那来试一试

注意sort底层使用的快速排序,结构是线性结构,而map并不是线性结构而是树形结构,因此要把map里的数据放在vector,才能使用sort。
sort默认是升序,第一个版本是按照operator<比较的,第二个是按照comp比较的也就是说我们给它提供一个仿函数按照自己的想法比较。
在这里插入图片描述
由TOP-K我们就知道如果直接让pair对比会有问题,所以我们选第二种。

class Solution {
public:
    struct Compare
    {
        bool operator()(const pair<string,int>& l,const pair<string,int>& r)
        {
            return l.second > r.second || (l.second == r.second && l.first < r.first);
        }
    };

    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string,int> mp;
        for(auto& str:words)
        {
            mp[str]++;
        }
        
        vector<string> ret;
        vector<pair<string,int>> v;
        for(auto& e:mp)
        {
            v.push_back(e);
        }
		//这个Compare我们是按照降序进行判断的
        sort(v.begin(),v.end(),Compare());

        for(int i=0;i<k;++i)
        {
            ret.push_back(v[i].first);
        }

        return ret;
   }
};

这样也能解决问题,不过这样的sort并不能保持稳定性,需要我自己手动控制才能保持稳定性以达到相同次数按 字典顺序 排序。
下面介绍一种稳定的排序算法。
在这里插入图片描述
stable_sort,可以保持排序的稳定性。
在这里插入图片描述
i 在 love的前面,出现次数相同,i 依旧在 love前面。

class Solution {
public:
    struct Compare
    {
        bool operator()(const pair<string,int>& l,const pair<string,int>& r)
        {
            return l.second > r.second ;
        }
    };

    vector<string> topKFrequent(vector<string>& words, int k) {
        map<string,int> mp;
        for(auto& str:words)
        {
            mp[str]++;
        }
        
        vector<string> ret;
        vector<pair<string,int>> v;
        for(auto& e:mp)
        {
            v.push_back(e);
        }
		//这个Compare我们是按照降序进行判断的
        //sort(v.begin(),v.end(),Compare());
        stable_sort(v.begin(),v.end(),Compare());

        for(int i=0;i<k;++i)
        {
            ret.push_back(v[i].first);
        }

        return ret;
   }
};

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1295963.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于YOLOv7算法和Caltech数据集的高精度行人目标检测识别系统(PyTorch+Pyside6+YOLOv7)

摘要&#xff1a;基于YOLOv7算法和Caltech数据集的高精度行人目标检测系统可用于日常生活中检测与定位行人目标&#xff0c;此系统可完成对输入图片、视频、文件夹以及摄像头方式的目标检测与识别&#xff0c;同时本系统还支持检测结果可视化与导出。本系统采用YOLOv7目标检测算…

宁盾统一身份中台助力某集团公司实现统一身份认证和管理(如泛微OA、微软AD)

某集团公司是一家以钢铁为主业&#xff0c;涉足互联网金融、文化健康、智慧城市、现代物流等多领域的大型现代化企业集团。创业发展已有三十余年&#xff0c;拥有员工人数超万人&#xff0c;为了提升管理效率&#xff0c;同时实现国产化创新和数字化转型&#xff0c;公司采用了…

大一python题库及答案,大一python期末必考题

大家好&#xff0c;小编来为大家解答以下问题&#xff0c;大一python题库及答案&#xff0c;大一python期末必考题&#xff0c;今天让我们一起来看看吧&#xff01; 本篇文章给大家谈谈大一python题库及答案&#xff0c;以及大一python期末必考题&#xff0c;希望对各位有所帮助…

排序算法-插入/希尔排序

1 插入排序 1.1基本思想&#xff1a; 直接插入排序是一种简单的插入排序法&#xff0c;其基本思想是&#xff1a;把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中&#xff0c;直到所有的记录插入完为止&#xff0c;得到一个新的有序序列 。 1.2直…

Si24R03—低功耗 SOC 芯片(集成RISC-V内核+2.4GHz无线收发器)

Si24R03是一款高度集成的低功耗SOC芯片&#xff0c;其集成了基于RISC-V核的低功耗MCU和工作在2.4GHz ISM频段的无线收发器模块。 MCU模块具有低功耗、Low Pin Count、宽电压工作范围&#xff0c;集成了13/14/15/16位精度的ADC、LVD、UART、SPI、I2C、TIMER、WUP、IWDG、RTC等丰…

12月8日作业

题目&#xff1a; 使用手动连接&#xff0c;将登录框中的取消按钮使用qt4版本的连接到自定义的槽函数中&#xff0c;在自定义的槽函数中调用关闭函数 将登录按钮使用qt5版本的连接到自定义的槽函数中&#xff0c;在槽函数中判断ui界面上输入的账号是否为"admin"&am…

【超详细教程】FL Studio 21中文破解版,让你的音乐制作更出彩啦!

嗨小仙女们&#xff01;今天小助理要跟大家分享一个超赞的消息&#xff01;你们知道吗&#xff0c;FL Studio 21中文破解版终于来啦&#xff01; FL Studio 21是一款超级火爆的音乐制作软件&#xff0c;不仅功能强大&#xff0c;而且操作简单&#xff0c;适合各种水平的音乐制…

Python Django-allauth: 构建全面的用户身份验证系统

更多资料获取 &#x1f4da; 个人网站&#xff1a;ipengtao.com Django-allauth是一个功能强大的Django插件&#xff0c;旨在简化和定制Web应用程序中的用户身份验证和管理。本文将深入介绍Django-allauth的核心功能、基本用法以及实际应用场景&#xff0c;通过丰富的示例代码…

【数据结构】插入排序,希尔排序,选择排序,堆排序,冒泡排序

1.插入排序 思路&#xff1a;插入排序将一个数插入一个有序的数组里面&#xff0c;将这个数和数组元素挨着比较&#xff0c;直到他插入到合适的位置。 动画演示&#xff1a; 步骤&#xff1a;1.定义一个变量tmp保存要插入的数据 2.在循环中用tmp和有序数组中的元素比较&#…

SpringBoot Seata 死锁问题排查

现象描述&#xff1a;Spring Boot项目&#xff0c;启动的时候卡住了&#xff0c;一直卡在那里不动&#xff0c;没有报错&#xff0c;也没有日志输出 但是&#xff0c;奇怪的是&#xff0c;本地可以正常启动 好吧&#xff0c;姑且先不深究为什么本地可以启动而部署到服务器上就无…

软件压力测试的重要性与用途

在当今数字化的时代&#xff0c;软件已经成为几乎所有行业不可或缺的一部分。随着软件应用规模的增加和用户数量的上升&#xff0c;软件的性能变得尤为关键。为了确保软件在面对高并发和大负载时仍然能够保持稳定性和可靠性&#xff0c;软件压力测试变得至关重要。下面是软件压…

python 使用 AppiumService 类启动appium server

一、前置说明 在Appium的1.6.0版本中引入了AppiumService类&#xff0c;可以很方便的通过该类来管理Appium服务器的启动和停止。 二、操作步骤 import osfrom appium.webdriver.appium_service import AppiumService as OriginalServerfrom libs import pathclass AppiumSer…

Python入门第1篇

前言 很久之前就知道有python这个东西&#xff0c;当时也想的学学&#xff0c;不过一直没做行动派。 那时候就听说用python进行Excel数据分析处理、爬虫等很是厉害&#xff0c;但是始终没有与python的关系更进一步。 Python简介 用我自己的话说&#xff0c;python也是一门面…

【面试经典150 | 二叉树】对称二叉树

文章目录 写在前面Tag题目来源解题思路方法一&#xff1a;递归方法二&#xff1a;迭代 写在最后 写在前面 本专栏专注于分析与讲解【面试经典150】算法&#xff0c;两到三天更新一篇文章&#xff0c;欢迎催更…… 专栏内容以分析题目为主&#xff0c;并附带一些对于本题涉及到的…

c 语言 堆的解析(自我理解)!!!堆排序,建堆

1.堆是什么&#xff1f; 首先先看一个图片 小顶堆的意思就是顶 的元素最小&#xff0c;两个子节点的元素要大于父节点。大顶堆同理。 小顶堆就像是一个金字塔。第一层很小&#xff0c;然后后面是依次增大&#xff0c;就像社会人才金字塔图一样。 大顶堆就可以想做&#xff0…

cesium学习记录

有段时间自学了cesium&#xff0c;这里记录一下自学过程&#xff0c;希望在所需之时查阅~~ 1、cesium源码获取与Index页面介绍 官网网址 www.cesiumjs.org 源代码下载&#xff1a;Platform-Dowmloads 在index.html右击open with Live server开启本地服务 点击Documentation…

RESTful API,以及如何使用它构建 web 应用程序。

RESTful API是一种基于REST&#xff08;Representational State Transfer&#xff09;架构风格的API&#xff08;Application Programming Interface&#xff09;&#xff0c;它采用HTTP协议中的GET、POST、PUT、DELETE等方法&#xff0c;对资源进行操作。RESTful API的核心思想…

Python (四)读写word

程序员的公众号&#xff1a;源1024&#xff0c;获取更多资料&#xff0c;无加密无套路&#xff01; 最近整理了一份大厂面试资料《史上最全大厂面试题》&#xff0c;Springboot、微服务、算法、数据结构、Zookeeper、Mybatis、Dubbo、linux、Kafka、Elasticsearch、数据库等等 …

HarmonyOS Developer——鸿蒙【构建第一个JS应用(FA模型)】

创建JS工程 JS工程目录结构 构建第一个页面 构建第二个页面 实现页面间的跳转 使用真机运行应用 说明 为确保运行效果&#xff0c;本文以使用DevEco Studio 3.1 Release版本为例&#xff0c;点击此处获取下载链接。 创建JS工程 若首次打开DevEco Studio&#xff0c;请点击…

【漏洞复现】万户协同办公平台ezoffice wpsservlet接口存在任意文件上传漏洞 附POC

漏洞描述 万户ezOFFICE集团版协同平台以工作流程、知识管理、沟通交流和辅助办公四大核心应用 万户ezOFFICE协同管理平台是一个综合信息基础应用平台。 万户协同办公平台ezoffice wpsservlet接口存在任意文件上传漏洞。 免责声明 技术文章仅供参考,任何个人和组织使用网络应…