Spark on hive Hive on spark

Spark on hive Hive on spark

news2026/2/13 13:23:31

文章目录

- Spark on hive & Hive on spark
- - Hive 架构与基本原理
  - Spark on hive
  - Hive on spark

Spark on hive & Hive on spark

Hive 架构与基本原理

在这里插入图片描述

Hive 的核心部件主要是 User Interface（1）和 Driver（3）。而不论是元数据库（4）、存储系统（5），还是计算引擎（6），Hive 都以“可插拔”的方式交给第三方独立组件。

Hive sql查询工作流程：

接收到 SQL 查询之后， Hive 的 Driver 首先使用其 Parser 组件，将查询语句转化为 AST（Abstract Syntax Tree，查询语法树）。
Planner 组件根据 AST 生成执行计划，而 Optimizer 则进一步优化执行计划。要完成这一系列的动作，Hive 必须要拿到相关数据表的元信息，比如表名、列名、字段类型、数据文件存储路径、文件格式，等等；元信息存储在“Hive Metastore”（4）的数据库中。

Hive Metastore 是一个普通的关系型数据库（RDBMS），它的作用：

辅助SQL 语法解析、执行计划的生成与优化；
帮助底层计算引擎高效地定位并访问分布式文件系统中的数据源；

Spark on hive

在这里插入图片描述

Spark on Hive是spark做sql解析并转换成RDD执行，hive仅仅是做为外部数据源

Spark SQL 对 SQL 查询语句先后进行语法解析、语法树构建、逻辑优化、物理优化、数据结构优化、以及执行代码优化，等等。然后Spark SQL 将优化过后的执行计划，交付给 Spark Core执行引。

Hive on spark

在这里插入图片描述

“Hive on Spark” 指的是 Hive 采用 Spark 作为其后端的分布执行引擎。

Hive on Spark 是由 Hive 的 Driver 来完成 SQL 语句的解析、规划与优化，还需要把执行计划“翻译”成 RDD 语义下的 DAG，然后再把 DAG 交付给 Spark Core执行。【Spark on hive是由Spark SQL + Spark Core执行，性能更好】

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/347502.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

webpack(高级)--性能优化-代码分离

webpack(高级)--性能优化-代码分离

webpack webpack性能优化优化一：打包后的结果上线时的性能优化 （比如分包处理减少包体积 CDN服务器） 优化二：优化打包速度开发或者构建优化打包速度 （比如exclude cache-loader等） 大多数情况下我们侧…

阅读更多...

css 安全区域 safe-area-inset-

css 安全区域 safe-area-inset-

前言安全区域与边界是iOS11 新增特性。安全区域安全区域的内容不受圆角（corners）、齐刘海（sensor housing）、小黑条（Home Indicator）影响。Webkit 为此增加了相应的CSS 函数，用于获取安全…

阅读更多...

B树系列与MySQL数据库

B树系列与MySQL数据库

前篇提到B树及其实现：一文看懂---B树及其简单实现_b树实现_且随疾风前行->的博客-CSDN博客本篇继续谈B树系列的B树，B*树和它们与MySQL数据库的关系。目录 B树系列 B树 B树的特性： B*树 B树系列总结 MySQL索引简介 MyISAM Inno…

阅读更多...

Sphinx文档生成工具（二）

Sphinx文档生成工具（二）

rst语法官方的语法手册行内的样式： #斜体 *message* #粗体 **message** #等宽不能有换行 message标题一级标题 ^^^^^^^^ 二级标题 --------- 三级标题 >>>>>>>>> 四级标题 ::::::::: 五级标题六级标题 """"…

阅读更多...

Vue+node.js医院预约挂号信息管理系统vscode

Vue+node.js医院预约挂号信息管理系统vscode

网上预约挂号系统将会是今后医院发展的主要趋势。前端技术：nodejsvueelementui,视图层其实质就是vue页面，通过编写vue页面从而展示在浏览器中，编写完成的vue页面要能够和控制器类进行交互，从而使得用户在点击网页进行操作时能够正…

阅读更多...

关于 mysql数据库插入中文变空白的解决方法

关于 mysql数据库插入中文变空白的解决方法

若该文为原创文章，转载请注明原文出处本文章博客地址：https://hpzwl.blog.csdn.net/article/details/129048030 红胖子网络科技的博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软…

阅读更多...

Session详解，学习 Session对象一篇文章就够了

Session详解，学习 Session对象一篇文章就够了

目录 1 Session概述 2 Session原理 3 Session使用 3.1 获取Session 3.2 Session保存数据 3.3 Session获取数据 3.4 Session移除数据 4 Session与Request应用区别 4.1 Session和request存储数据 4.2 获取session和request中的值 4.3 session和request区别效果 5 Sess…

阅读更多...

Transformer：开启CV研究新时代

Transformer：开启CV研究新时代

来源：投稿作者：魔峥编辑：学姐起源回顾有关Attention的论文早在上世纪九十年代就提出了。在2012年后的深度学习时代，Attention再次被翻了出来，被用在自然语言处理任务，提高RNN模型的训练速度。但是由…

阅读更多...

数据库(4)--视图的定义和使用

数据库(4)--视图的定义和使用

一、学习目的加深对视图的理解，熟练视图的定义、查看、修改等操作二、实验环境 Windows 11 Sql server2019 三、实验内容学生（学号，年龄，性别，系名） 课程（课号，课名，…

阅读更多...

收藏|一文掌握数据分析在企业的实际流程

收藏|一文掌握数据分析在企业的实际流程

一、数据分析概念 1.1 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，将他们加以汇总和理解并消化，以求最大化地开发数据的功能，发挥数据的作用。 1.2 数据分析包括描述性数据分析（初级数据分析）…

阅读更多...

兼职平台小程序【源码好优多】

兼职平台小程序【源码好优多】

简介微信小程序兼职平台以及问答悬赏平台的整合项目，兼职平台以及问答社区，是一个可以用于学生项目开发或者毕设的小型项目。功能介绍微信授权登录用户兼职选择优质学长/学姐推荐兼职推荐问答板块评论/回复板块用户个人中心页面截图 …

阅读更多...

深度学习Week15-common.py文件解读（YOLOv5）

深度学习Week15-common.py文件解读（YOLOv5）

目录简介一.基本组件 1.1autopad 1.2Conv 1.3 Focus 1.4Bottleneck 1.5BottleneckCSP 1.6 C3 1.7 SPP 1.8Concat 1.9Contract、Expand 二、重要类 2.1非极大值抑制（NMS） 2.2AutoShape 2.3 Detections 2.4 Classify 三、实验 &#x1f…

阅读更多...

WGCNA | 值得你深入学习的生信分析方法！~（网状分析-第三步-模块与特征分析）

WGCNA | 值得你深入学习的生信分析方法！~（网状分析-第三步-模块与特征分析）

1写在前面之前我们完成了WGCNA输入数据的清洗，网络构建和模块识别。😘 而且还介绍了如何对大型数据分级处理，有效地减少了内存的负担。😷 接着就是最重要的环节了，将不同module与表型或者临床特征相联系，进…

阅读更多...

共享模型之工具(一)

共享模型之工具(一)

1.线程池 1.1.线程池产生背景 1>.线程是一种系统资源,每创建一个新的线程都需要占用一定的内存(分配栈内存),在高并发场景下,某一时刻有大量请求访问系统,如果针对每个请求(任务)都创建一个新的线程,那么对内存的占用是相当大的,有可能还出现OOM(内存溢出),甚至会导致整个…

阅读更多...

配置中心Config

配置中心Config

引入依赖<parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.0.6.RELEASE</version></parent><properties><spring-cloud.version>Finchley.SR…

阅读更多...

设计模式：桥接模式让抽象和实现解耦，各自独立变化

设计模式：桥接模式让抽象和实现解耦，各自独立变化

一、问题场景现在对”不同手机类型“的 “不同品牌”实现操作编程(比如: 开机、关机、上网，打电话等) 二、传统解决方案传统方案解决手机使用问题类图： 三、传统方案分析传统方案解决手机操作问题分析 1、扩展性问题(类爆炸)，如果我们…

阅读更多...

JavaのString类这一篇就够了(包含StringBuffer_Builder)

JavaのString类这一篇就够了(包含StringBuffer_Builder)

1.🥗String类简介在我们写代码的时候，String总是充斥着前前后后。但你会不会经常力不从心， “这个*** 字符串怎么** 转换不成功啊” “*** 这个字符串到底是常量还是对象啊” “这*** 字符串内存结构到底* * * 是什么啊” “为啥我的字符串…

阅读更多...

Java 在二叉树中增加一行

Java 在二叉树中增加一行

623. 在二叉树中增加一行中等给定一个二叉树的根 root 和两个整数 val 和 depth ，在给定的深度 depth 处添加一个值为 val 的节点行。注意，根节点 root 位于深度 1 。加法规则如下:给定整数 depth，对于深度为 depth - 1 的每个非空树节点 cur…

阅读更多...

LeetCode 83. 删除排序链表中的重复元素

LeetCode 83. 删除排序链表中的重复元素

原题链接难度：easy\color{Green}{easy}easy 题目描述给定一个已排序的链表的头 headheadhead ， 删除所有重复的元素，使每个元素只出现一次。返回已排序的链表。示例 1： 输入：head [1,1,2] 输出：…

阅读更多...

Springboot+ElasticSearch构建博客检索系统-学习笔记01

Springboot+ElasticSearch构建博客检索系统-学习笔记01

课程简介：从实际需求分析开始，打造个人博客检索系统。内容涵盖：ES安装、ES基本概念和数据类型、Mysql到ES数据同步、SpringBoot操作ES。通过本课，让学员对ES有一个初步认识，理解ES的一些适用场景，以及如何使…

阅读更多...

推荐文章

最新文章