【大数据入门核心技术-Impala】（一）Impala简介

news2025/1/9 1:07:15

目录

一、Impala介绍

二、Impala优势

三、Impala主要功能

一、Impala介绍

Impala是Cloudera公司主导开发的新型查询系统，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义，但由于Hive底层执行使用的是MapReduce引擎，仍然是一个批处理过程，难以满足查询的交互性。相比之下，Impala的最大特点也是最大卖点就是它的快速。

Impala 是建立在 Hadoop 生态圈的交互式 SQL 解析、执行引擎，Impala 的 SQL 语法与 Hive 高度兼容，并且提供标准的 ODBC 和 JDBC 接口。
Impala 本身不提供数据的存储服务，其底层数据可来自 HDFS、Kudu、Hbase。

二、Impala优势

Impala不需要把中间结果写入磁盘，省掉了大量的I/O开销。
省掉了MapReduce作业启动的开销。MapReduce启动task的速度很慢（默认每个心跳间隔是3秒钟），Impala直接通过相应的服务进程来进行作业调度，速度快了很多。
Impala完全抛弃了MapReduce这个不太适合做SQL查询的范式，而是像Dremel一样借鉴了MPP并行数据库的思想另起炉灶，因此可做更多的查询优化，从而省掉不必要的shuffle、sort等开销。
通过使用LLVM来统一编译运行时代码，避免了为支持通用编译而带来的不必要开销。
用C++实现，做了很多有针对性的硬件优化，例如使用SSE指令。
使用了支持Data locality的I/O调度机制，尽可能地将数据和计算分配在同一台机器上进行，减少了网络开销。

三、Impala主要功能

1.Impala可以根据Apache许可证作为开源免费提供。

2.Impala支持内存中数据处理，它访问/分析存储在Hadoop数据节点上的数据，而无需数据移动。

3.使用类SQL查询访问数据。

4.Impala为HDFS中的数据提供了更快的访问。

5.可以将数据存储在Impala存储系统中，如Apache HBase和Amazon s3。

6.Impala支持各种文件格式，如LZO，序列文件，Avro，RCFile和Parquet。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/76870.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

代码详细教程+文档+PPT+源码等]SSM框架美妆商城全套|电商购物计算机专业毕业论文java毕业设计网站

代码详细教程+文档+PPT+源码等]SSM框架美妆商城全套|电商购物计算机专业毕业论文java毕业设计网站

💖💖更多项目资源，最下方联系我们✨✨✨✨✨✨ 目录 Java项目介绍资料获取 Java项目介绍计算机毕业设计java毕设之SSM美妆商城项目源码_哔哩哔哩_bilibili项目资料网址: http://itzygogogo.com软件下载地址:http://itzygogogo.com/itsz…

阅读更多...

[附源码]Python计算机毕业设计SSM基于框架的在线健康系统设计与实现（程序+LW)

[附源码]Python计算机毕业设计SSM基于框架的在线健康系统设计与实现（程序+LW)

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： SSM mybatis Maven Vue 等等组成，B/S模式 M…

阅读更多...

DRF和vue跨域问题的解决

DRF和vue跨域问题的解决

跨域不一定都会有跨域问题： 因为跨域问题是浏览器对于ajax请求的一种安全限制：一个页面发起的ajax请求，只能是与当前页域名相同的路径，这能有效的阻止跨站攻击。因此，跨域问题是针对ajax的一种限制。但是这却给我们…

阅读更多...

Birdboot第二天 Request Response

Birdboot第二天 Request Response

目录 V4 HttpServletRequest保存请求内容 1.此类专门处理请求把获取请求的readline()和拆分代码移动过来 2.ClientHandler客户端处理器实例化HttpServletRequest 3. 拆分的信息从局部变量变成属性 4.建方法解析请求行消息头消息正文 V5 发送响应 1.在客户端处理器 …

阅读更多...

BI智慧仓储，带你体验数字化仓储物流管理

BI智慧仓储，带你体验数字化仓储物流管理

1、行业背景智能仓储物流是以信息交互为主线，使用条形码、射频识别、传感器、全球定位系统等先进的物联网技术，集成自动化、信息化、人工智能技术，通过信息集成、物流全过程优化以及资源优化，使物品运输、仓储、配送、包装、装…

阅读更多...

【小f的刷题笔记】（JS）链表 - 合并 k 个有序链表 LeetCode23 - 顺序合并暴力三种方法

【小f的刷题笔记】（JS）链表 - 合并 k 个有序链表 LeetCode23 - 顺序合并暴力三种方法

【链表】合并 k 个有序链表： 🌟 想办法从一堆节点中找到最小的那个节点看了很多题解，主要是以下四种方法（优先队列我还没有写出来，先遗留着）： ✔ 顺序合并 ✔ 分治合并（归并&a…

阅读更多...

【单片机】矩阵键盘/定时器

【单片机】矩阵键盘/定时器

目录一、矩阵键盘 1、矩阵按键原理 1.1工作方式 1.2工作原理 1.3单片机IO口 2、矩阵键盘数字显示代码 3、矩阵键盘密码锁二、定时器（工作模式1） 1、定时器的原理 2、寄存器 2.1模式选择寄存器TMOD（不可位寻址） 2.2…

阅读更多...

CentOS 搭建 WordPress 站点

CentOS 搭建 WordPress 站点

博客链接:https://www.aiiyx.cn 内容纲要 1. 版本相关2. 主要内容3. 安装并配置 PHP4. 安装并配置 WordPress5. 配置 Nginx6. 配置 MySQL7. 初始化 WordPress 1. 版本相关 WordPress 版本 5.9.3PHP 版本 8.1MySQL 版本 5.7Nginx 版本 1.18 2. 主要内容由于我的 CentOS 服务…

阅读更多...

ChatGPT：将你的微信变成智能聊天机器人！

ChatGPT：将你的微信变成智能聊天机器人！

天天用微信的你有没有做个这样一种设想：让最先进的人工智能算法帮你聊天! 这机器人可以回答各种问题，上知天文下知地理，甚至还能写代码。无论是哄女朋友，应付老婆，或者勾搭陌生小姐姐，都能做到24小时在线&…

阅读更多...

一文带领大家了解什么是泛型

一文带领大家了解什么是泛型

对于泛型！其实大家了解不是很多，在各大高校的学习中，如果你不去深入的了解泛型，老师只是会一水儿过，并不会单独去带领大家了解！！那么，笔者结合自身的学习泛型的想法，结合…

阅读更多...

2022年双十二拼多多百亿补贴有活动吗?如何领红包?

2022年双十二拼多多百亿补贴有活动吗?如何领红包?

2022年双十二拼多多百亿补贴有活动吗?如何领红包? 拼多多的活动大家都很清楚，平常没有活动的时候，价格也是比较实惠的，除了拼团购物之外，拼多多还有百亿补贴，所以商品比其他平台都要便宜，双十二拼多多百亿…

阅读更多...

物理数据库服务器扫描hba卡识别共享磁盘命令

物理数据库服务器扫描hba卡识别共享磁盘命令

1、问题背景默认情况，在扩容完1套物理rac共享存储后，rac主机是不能识别共享存储的。那么该怎么办呢？ 2、解决办法例如，在扩容完1套物理rac共享存储后，如果rac主机不能识别共享存储的话(一般需要执行命令后&#x…

阅读更多...

Jboss弱口令Getshell

Jboss弱口令Getshell

文章目录漏洞简介影响版本环境搭建漏洞复现漏洞简介 JBoss Administration Console存在默认账号密码admin/vulhub，如果Administration Console可以登录，就可以在后台部署war包getshell 影响版本 Jboss4.x及其之前的版本 console 管理路径为/jmx-consol…

阅读更多...

day16【代码随想录】反转字符串、反转字符串中的元音字母、反转字符串||、反转字符串中的单词|||、替换空格、翻转字符串中的单词、左旋转字符串

day16【代码随想录】反转字符串、反转字符串中的元音字母、反转字符串||、反转字符串中的单词|||、替换空格、翻转字符串中的单词、左旋转字符串

文章目录一、反转字符串（力扣344）二、反转字符串中的元音字母（力扣345）三、反转字符串 II（力扣541）四、反转字符串中的单词 III（力扣557）五、替换空格（剑指 Offer 05&…

阅读更多...

Kubernetes ~ k8s 从入门到入坑。

Kubernetes ~ k8s 从入门到入坑。

Kubernetes ~ k8s 从入门到入坑。文章目录Kubernetes ~ k8s 从入门到入坑。1. Kubernetes 介绍。1.1 应用部署方式演变。1.2 kubernetes 简介。1.3 kubernetes 组件。1.4 kubernetes 概念。2. kubernetes 集群环境搭建。2.1 前置知识点。2.2 kubeadm 部署方式介绍。2.3 安装要…

阅读更多...

人工智能前沿——玩转OpenAI聊天机器人ChatGPT（免费中文版）

人工智能前沿——玩转OpenAI聊天机器人ChatGPT（免费中文版）

目录 2022 地表最强AI聊天机器人ChatGPT诞生！！！ 一、前言 🎄🎈 ChatGPT是OpenAI开发的一个大型预训练语言模型。它是GPT-3模型的变体，GPT-3经过训练，可以在对话中生成类似人类的文本响应。Cha…

阅读更多...

Vite + Vue3 项目中，使用 vw/vh 适配移动端，并通过 Android Studio 打包

Vite + Vue3 项目中，使用 vw/vh 适配移动端，并通过 Android Studio 打包

目录 1. 使用 vw/vh 适配移动端 1.1 使用 vite 初始化项目 1.2 安装插件，将 px 转化成 vw 1.2.1 在 vite.config.ts 中，声明插件 1.2.2 手写 postcss 类型声明文件，解决路径爆红、没有提示 1.2.3 tsconfig.config.json VS tsconfig.js…

阅读更多...

Java 8 Stream 之 collect() 的奇技淫巧！

Java 8 Stream 之 collect() 的奇技淫巧！

前言本身我是一个比较偏向少使用Stream的人，因为调试比较不方便。但是, 不得不说，stream确实会给我们编码带来便捷。所以还是忍不住想分享一些奇技淫巧。正文 Stream流其实操作分三大块 ： 创建处理收集我今天想分享的是收集…

阅读更多...

核心内参：S参数的三个重要特性——因果性、无源性与互异性

核心内参：S参数的三个重要特性——因果性、无源性与互异性

1 从一个报错开始 S参数在射频、高速领域的应用非常广泛，相关知识点也非常多。最近浏览了一本2020年新出版的书《S Parameter for Signal Integrity》，作者是IEEE Fellow、业界大牛Peter J. Pupalaikis，现任职于Teledyne LeCroy。该书写的非…

阅读更多...

《Linux运维实战：使用Percona Backup for MongoDB备份与恢复Mongodb数据》

《Linux运维实战：使用Percona Backup for MongoDB备份与恢复Mongodb数据》

一、备份与恢复方案 Percona Backup for MongoDB 是一个开源、分布式和低影响的解决方案，用于MongoDB分片集群和副本集的一致备份。从版本1.7.0开始，Percona Backup for MongoDB支持物理和逻辑备份和恢复，仅支持对逻辑备份进行时间点恢复。 …

阅读更多...

推荐文章

最新文章