hive在IDEA中debug

news2025/7/3 4:20:52

一、hive在IDEA中debug

安装hadoop环境（1和2替换顺序也可以）

注：hadoop环境不需要从源码编译

https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html

按照官网教程编译源码

https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-BuildingHivefromSource

注意事项：maven环境中使用JDK8，否则会出问题

按照上面2个官网的教程配置好环境，（hive还需要配置mysql，官网没有提）
开启debug，在$HIVE_HOME/bin下操作：
- hive-client debug：
  
  注：在hive-client中debug只可以看到客户端的提交任务的逻辑，看不到sql是如何解析的，sql解析的逻辑需在hive-server中debug
  - 启动hiveserver2：./hiveserver2
  - 启动beeline：beeline -u jdbc:hive2://localhost:10000 --debug
    
    注：debug不是和beeline绑定的，而是单独的一个脚本文件，hive-server debug也可以使用同样的方式，具体实现细节可以看下bin/hive和bin/ext/debug.sh文件
  - 在idea中配置
  - 在配置之后在beeline类中打上断点，点debug按钮即可
- hive-server debug：
  - hive-server debug的方式和 hive-client 一样，是在启动hiveServer2的时候开启debug
    
    hiveserver2 --debug
    
    在idea中点debug
  - 在hiveserver2的debug都通过后，hiveserver2就启动起来了，这时候启动beeline
    
    beeline -u jdbc:hive2://localhost:10000

在这里插入图片描述

二、udf的调用流程（目前只梳理了部分）

hiveserver2在启动的时候会加载udf函数到map里
生成SQLOperation，封装了输入的sql语句，执行引擎，配置信息。sql：select name, abs(age) from first_test;

在这里插入图片描述

Operation.run()
1. 生成ast

在这里插入图片描述

生成执行计划

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/164018.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

软件工程专业课实验报告

软件工程专业课实验报告

一、结构化分析方法1.1需求描述教务管理子系统的需求描述：教务管理是一项需求周密计划、严谨安排的工作，要依据教师、学生信息进行合理安排。开学阶段，需要教师提交开课申请进行开课，学生根据老师的开课信息，选择课程&…

阅读更多...

uview 使用遇到的问题。

uview 使用遇到的问题。

uviewuniappvue，uView是uni-app生态专用的UI框架。 1. 注意uview版本，uview 2.0与uview1.0 官方提示：uView2.0是继1.0以来的一次重大更新，2.0已全面兼容nvue。因此在接手项目的时候首先得看清楚，之前开发的是uview…

阅读更多...

【自学Python】Python获取字符串长度

【自学Python】Python获取字符串长度

Python获取字符串长度 Python获取字符串长度教程在 Python 中要想获取字符串长度可以使用 len() 函数。 Python len()函数详解定义我们将要获取的字符串的长度，传进 len() 函数，即可实现获取字符串的长度。语法 len(string)参数参数描述s…

阅读更多...

【7】K8s_Ingress | Service的统一网关入口

【7】K8s_Ingress | Service的统一网关入口

目录 1、Ingress简介 2、安装ingress 【1】制作ingress.yaml文件并执行【2】测试，创建一个test.yaml文件并执行【3】设置域名访问，用yaml文件【4】路径重写【5】流量限制 1、Ingress简介 Ingress: Service的统一网关入口是k8s中的一个api对象&…

阅读更多...

时序数据库TDengine基本概念和建模思路

时序数据库TDengine基本概念和建模思路

目录一、时序数据库基本概念采集量标签数据采集点表超级表子表库二、 TDengine数据库建模策略建表模式建表情形行列数据库存储的区别： 接触的传统业务的数据模式都是行存储，我们会把不同类型的对象创建不同的表进行存储他们各自的属…

阅读更多...

机器学习公式推导与代码实现-无监督学习模型

机器学习公式推导与代码实现-无监督学习模型

聚类分析与k均值聚类算法督学习算法。在给定样本的情况下，聚类分析通过度量特征相似度或者距离，将样本自动划分为若干类别。距离度量和相似度度量方式距离度量和相似度度量是聚类分析的核心概念，大多数聚类算法建立在距离度量之上。常用的距离度量方式包括闵氏距离和马…

阅读更多...

linux系统中使用QT来实现数据库的调用方法

linux系统中使用QT来实现数据库的调用方法

大家好，今天主要和大家分享一下，如何使用QT中数据库的使用方法。目录第一：数据库基本简介第二：数据库表格基本操作第三：数据库最终效果第一：数据库基本简介数据库是按照数据结构来组织，…

阅读更多...

视频目标检测与轨迹跟踪代码案例

视频目标检测与轨迹跟踪代码案例

前言通过阅读相关文献及测试，找到了一种基于多模板匹配的改进方法，可以对遥感视频卫星中的移动目标进行探测，并绘制其轨迹。根据实验结果发现，可以比较有效的对运动目标进行跟踪。一、原理核心思想比较简单。即通过不同旋转角度的…

阅读更多...

AQS之ReentrantLock详解

AQS之ReentrantLock详解

非公平锁加锁过程一般我们在使用ReentrantLock的时候，代码如下：Test public void test(){ReentrantLock lock new ReentrantLock();lock.lock();try{//编写业务逻辑}catch (Exception e){lock.unlock();} }当我们在用ReentrantLock独占锁的时候&#xf…

阅读更多...

current并发包

current并发包

并发包 current并发包、在JDK1.5之前Java并没有提供线程安全的一些工具类去操作多线程，需要开发人员自行编写实现线程安全，但仍然无法完全避免低性能、死锁、资源管理等问题。在JDK1.5时新增了java.util.current并发包，其中提供了许多供我们…

阅读更多...

【自学Python】Python截取字符串

【自学Python】Python截取字符串

Python截取字符串 Python截取字符串教程在 Python 中，我们需要截取字符串，不需要使用特定的函数，只需要使用下标索引加上切片的形式，就可以实现字符串的截取。 Python字符 Python 中没有单个字符的概念，单个字符…

阅读更多...

uni-app 微信小程序通过Vue3 Hooks 实现动态填充页面剩余高度

uni-app 微信小程序通过Vue3 Hooks 实现动态填充页面剩余高度

应用场景在uni-app开发微信小程序等项目时，经常会遇到这样的页面布局需求：上半部分高度固定，下半部分自动占满剩余高度，如下图所示应用场景：上半部分为固定高度或内容填充高度的内容区域下半部分为scroll-view滑动区…

阅读更多...

河北稳控科技振弦采集模块配置工具VMTool的常见功能

河北稳控科技振弦采集模块配置工具VMTool的常见功能

河北稳控科技振弦采集模块配置工具VMTool的常见功能一、实时数据读取当 VMTool 与模块为连接状态时（ 4.3.1 模块的连接与断开）， 勾选实时数据区的【自动读取】复选框， VMTool 开始自动向模块发送实时数据读取指令&#xff0c…

阅读更多...

如何用 Java 来构建一个简单的速率限制器？

如何用 Java 来构建一个简单的速率限制器？

速率限制现实世界中的用户是残暴的，并且没耐心，充满着各种不确定性。在高并发系统中，可能会出现服务器被虚假请求轰炸的情况，因此您可能希望控制这种情况。一些实际使用情形可能如下所示： API配额管理-作为提供者…

阅读更多...

28.函数指针变量作为函数的参数，容易混淆的指针概念，特殊指针，main函数传参

28.函数指针变量作为函数的参数，容易混淆的指针概念，特殊指针，main函数传参

1.函数指针变量作为函数的参数 #include<stdio.h> int add(int x, int y) {return x y; } int sub(int x, int y) {return x - y; } int mux(int x, int y) {return x * y; } int dive(int x, int y) {return x / y; } int process(int(*p)(int, int),int x,int y) {in…

阅读更多...

Redis基础命令操作三之集合类型SET

Redis基础命令操作三之集合类型SET

SET集合特点：集合中存储的元素是惟一的。命令举例说明SADD sadd [key] [value1 value2 value3]key对应的集合中添加元素SMEMBERSsmembers [key]获取key对应的集合的所有元素SISMEMBERsismember [key] [value]判断value是否在key对应的集合中存在SCARDscard [key…

阅读更多...

excel日期函数：EDATE与DATE到底谁更胜一筹

excel日期函数：EDATE与DATE到底谁更胜一筹

平时的工作中，经常会遇到计算职工转正日期、合同到期日、职工退休日期以及产品有效期截止日等等与日期有关系的问题。这些问题看似复杂，实际上只需要一个很简单的函数就能搞定，这个函数就是EDATE。今天分享EDATE函数的几个应用实例&#xff0…

阅读更多...

【Linux】Linux 权限和权限管理

【Linux】Linux 权限和权限管理

文章目录Linux权限的概念Linux权限管理文件访问者的分类（人）文件类型和访问权限（事物属性)目录权限默认权限粘滞位关于权限的总结Linux权限的概念权限是用来限制人的，权限人事物属性权限存在的意义是便于系统安全管理的 Linux下…

阅读更多...

Python处理第一类切比雪夫多项式

Python处理第一类切比雪夫多项式

第一类切比雪夫多项式简介 Chebyshev多项式是一种非常重要的正交多项式，在逼近理论中有重要应用，第一类切比雪夫多项式的根可用于多项式插值，对弥补龙格现象有很大的帮助。其表达形式为 Tncos⁡(narccos⁡x)T_n\cos(n\arccos x) Tncos(nar…

阅读更多...

vite+vue3+Ts搭建基础项目框架

vite+vue3+Ts搭建基础项目框架

随着前端技术的更新，程序员们的技术栈也要不断跟上，本来想躺平，不料却被推着走。上个月开发团队新来一个项目需求，要求开发技术栈vue2更换成vue3，毫无准备的小编一脸懵，嗯？怎么说换就换了&am…

阅读更多...

推荐文章

最新文章