大数据开发之Hive案例篇5- count(distinct) 优化一例

news2025/2/24 9:11:12

文章目录

  • 一. 问题描述
  • 二. 解决方案
    • 2.1 调整reduce个数
    • 2.2 SQL改写

一. 问题描述

需求:
4895708a4e03a6ab96b34ae81456e58.png

卡在了reduce,只有一个reduce
MR job卡在了最后一个reduce,任务迟迟未运行成功
image.png

二. 解决方案

2.1 调整reduce个数

一般一个reduce处理的数据是1G,所以首先想能不能增加reduce的个数来调优上述Hive SQL。

-- 可以指定每个redcue处理的数据size,也可以直接指定reduce的个数
set hive.exec.reducers.bytes.per.reducer = 12000000;

经验证,调整了上述参数后,问题依旧没有得到解决。

2.2 SQL改写

上述SQL所代表的业务逻辑是求截止当前每分钟的用户访问数(如出现多次,只算一次)
SQL也是因为 count(distinct)的存在,导致reduce数分配少了,进而出现数据性能问题。

所以首先我们想想能不能把count(distinct)去掉
因为本身是离线数据,此时可以借助临时表,首先把每个用户首次访问的时间记录下来,这样就可以将处理的数据大大减少,最后再通过开窗函数处理即可。
完美解决:
image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/561850.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Dubbo核心 详解四】Dubbo服务提供者的详解

✅创作者:陈书予 🎉个人主页:陈书予的个人主页 🍁陈书予的个人社区,欢迎你的加入: 陈书予的社区 🌟专栏地址: Dubbo核心详解(附代码示例) 文章目录 引言一、服务提供者1.1 服务提供者介绍Dubbo 服务提供者启…

NPDP|产品经理的硬实力体现在哪里?

在企业里,产品经理是一个具有综合职能的职位,其工作的范围可以说已经遍及到了公司的每个角落其接触的人员也涉及公司几乎所有的部门。 产品经理是产品品牌塑造者、更是营销骨干,是一套完善的营销运作制度,更是博大精深的营销操作…

git clone 报错10054,解决方法

使用git clone下载工程时,报错提示如下: fatal: unable to access https://github.com/deozhang/GaoZhongShuXue.git/: OpenSSL SSL_read: Connection was reset, errno 10054 报错提示的代码是10054,根据提示和网上搜索结果,可以…

Ae:跟踪运动

使用跟踪器 Tracker面板的跟踪运动 Track Motion功能,可通过手动添加和设置跟踪点来跟踪对象的运动,并能将获得的跟踪数据应用于其它对象。 Ae菜单:窗口/跟踪器 Tracker 点击跟踪器面板上的“跟踪运动”按钮,会为图层添加“动态跟…

Charles使用教程【简易版】

Charles抓包教程 1、电脑安装charles 2、电脑打开charles后安装root证书 3、电脑信任证书 4、手机连接与电脑同一wifi 5、设置手机代理 wlan设置中将当前 wifi 的代理改成手动,主机名填电脑 ip,端口填8888 此时如果当前手机是第一次被你的电脑设备代理或…

【JavaSE】Java基础语法(四)

文章目录 🍼1. 循环细节🥢1.1 循环语句-dowhile循环🥢1.2 三种循环的区别🥢1.3 跳转控制语句 🍼2. Random🥢2.1 Random产生随机数🥢2.2 Random练习-猜数字 🍼1. 循环细节 &#x1f…

[资料分享]基于单片机防酒驾酒精检测报警系统装置设计、基于数字电路演讲计时protues仿真设计

基于单片机防酒驾酒精检测报警系统装置设计 一、说明 通过MQ3传感器检测酒精浓度,信号由ADCO832进行处理模数转化再到单片机进行处理,当检测到浓度超过“酒驾”报警值时,红灯亮起,当检测到浓度超过“醉驾”报警值时,…

网关网卡配置

Vmvare虚拟机设置外网IP 查看当前主机的网卡名/当前IP/子网掩码,网关地址 ifconfig route -n 查看DNS nslookup hcos 网卡名称为enp0s3,IP地址为10.0.2.15,子网掩码为255.255.255.0,网关为10.0.2.2; Centos设置IP/网…

【Java编程系列】gateway限流实践时发生的问题和解决方案

前期回顾: 【Java编程系列】Springcloud-gateway自带限流方案实践篇 1、实践中发生的问题 主要有以下几个问题: 1、限流返回的响应数据无法自定义 (LogFormatUtils.java:91) - [7b93af46-20] Completed 429 TOO_MANY_REQUESTS 返回后显示的情况如下&a…

C++第二章:变量和基本内置类型

变量和基本内置类型 一、基本内置类型1.1 算数类型1.2 带符号类型和无符号类型1.3 类型转换含有无符号类型的表达式 1.4 字面值常量整形和浮点型字面值字符和字符串字面值转义序列指定字面值的类型 二、变量2.1 变量的定义初始化列表初始化默认初始化 2.2 变量声明和定义的关系…

【web-ctf】ctf_BUUCTF_web(2)

文章目录 BUUCTF_webSQL注入1. [RCTF2015]EasySQL2. [CISCN2019 华北赛区 Day1 Web5]CyberPunk3. [CISCN2019 总决赛 Day2 Web1]Easyweb4. [GYCTF2020]Ezsqli5. [网鼎杯 2018]Comment 文件上传漏洞1. [WUSTCTF2020]CV Maker2. [NPUCTF2020]ezinclude3. [SUCTF 2019]EasyWeb 文件…

TADK 23.03 release note

主要功能概述: 基于深度学习的应用分类:在原有的基于机器学习的应用分类(AppID)能力基础上,扩展出新的深度学习参考模型和推理引擎。FFEL的raw byte特征提取:增加了流特征提取库(FFEL)对数据包中的raw byte特征提取能力&#xff0…

Meta AI 重磅推出LIMA!媲美GPT-4、无需RLHF就能对齐!

深度学习自然语言处理 原创作者:鸽鸽 昨天Meta AICMU这篇文章一出,twitter都炸了! LIMA,只使用1000个精心挑选的样本微调一个 65B LLaMa,无需RLHF,性能媲美甚至优于GPT-4! 论文:LIMA…

游戏洞察丨自来水还是井水,后流量时代的私域挑战

流量生意本质上是买卖用户浏览时间的生意,如果用户增长到顶,那就意味着供给到顶。对比 2021 年,2022 年的游戏出海在谷歌和 Facebook 上投入的广告成本几乎翻了一倍。新晋“渠道王者”TikTok 逐渐走进大家的视野。该现象背后的原因在于&#…

解决幂等问题,只需要记住这个口诀!

△Hollis, 一个对Coding有着独特追求的人△ 这是Hollis的第 417 篇原创分享 作者 l Hollis 来源 l Hollis(ID:hollischuang) 作为开发人员,我们每天都要开发大量的接口,其中包括了读接口和写接口,而对于写接…

将矩阵按指定对角线转化为一个上三角矩阵numpy.triu()方法

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 将矩阵按指定对角线转化为一个上三角矩阵 numpy.triu() 选择题 关于以下代码说法错误的一项是? import numpy as np a np.array([[1,2],[3,4]]) print("【显示】a\n",a) print(&…

应用程序和 API 攻击呈上升趋势

Akamai Technologies 发布了一份新的互联网现状报告,标题为“突破安全漏洞:针对组织的应用程序和 API 攻击的兴起”。 报告显示,亚太地区和日本(APJ)的金融服务业仍然是该地区受攻击最严重的行业,Web 应用…

大模型推理性能优化之KV Cache解读

0. 引言 做大模型性能优化的一定对KV Cache不陌生,那么我们对这个技术了解到什么程度呢?请尝试回答如下问题: KV Cache节省了Self-Attention层中哪部分的计算?KV Cache对MLP层的计算量有影响吗?KV Cache对block间的数据…

知识点滴 - 什么是膳食结构

膳食结构是指膳食中各类食物的数量及其在膳食中所占的比重,由于影响膳食结构的这些因素是在逐渐变化的,所以膳食结构不是一成不变的,人们可以通过均衡调节各类食物所占的比重,充分利用食品中的各种营养,达到膳食平衡&a…

适配器模式:代码接口的神奇转换

一、概要 适配器模式(Adapter Pattern)是一种结构型设计模式,它允许将一个类的接口转换成客户端所期望的另一个接口,使得原本由于接⼝不兼容⽽不能⼀起⼯作的那些类可以⼀起⼯作。通俗来讲,就是通过适配器来连接两个不…