【openLooKeng集成Hive连接器完整过程】

news2025/1/10 1:05:38

【openLooKeng集成Hive连接器完整过程】

  • 一、摘要
  • 二、正文
    • 2.1 环境说明
    • 2.2 Hadoop安装
      • 2.2.1. 准备工作
      • 2.2.2 在协调节点coordinator上进行安装hadoop
      • 2.2.3、将Hadoop安装目录分发到从节点worker
      • 2.2.4、在协调节点coordinator上启动hadoop集群
    • 2.3 MySQL安装
    • 2.4 Hive安装及基本操作
    • 2.5 openLooKeng配置Hive连接器
    • 2.6 openLooKeng操作Hive
  • 三、总结

一、摘要

本文主要介绍在openLooKeng中如何使用Hive连接器,并在Hive连接器上对表进行增删改查等操作。openLooKeng如想正常使用Hive连接器相关功能,前提是需要事先安装部署Hive,而Hive的安装依赖于Hadoop环境(如Hive使用远程模式安装则还需要依赖于MySQL,其元数据存储于MySQL中)。故,本文将先完成对Hadoop的安装和MySQL的安装,再对hive进行安装,最后在openLooKeng中配置Hive连接器即可。

二、正文

2.1 环境说明

  • 相关软件说明

    软件 说明
    Hadoop hadoop-2.7.7.tar.gz
    Hive apache-hive-2.3.3-bin.tar.gz
    openLooKeng hetu-server-1.10.0.tar.gz
    JDK 1.8.0_401
    MySQL 5.7.44
  • 拓扑结构
    在这里插入图片描述

2.2 Hadoop安装

2.2.1. 准备工作

  • 1、所有主机安装jdk
    上传jdk-8u401-linux-x64.tar.gz到/root目录下,执行如下解压安装:

    tar -zvxf jdk-8u401-linux-x64.tar.gz -C /opt
    

    配置环境变量,编辑/etc/profile文件,添加如下内容:

    # jdk
    export JAVA_HOME=/opt/jdk1.8.0_401
    export JRE_HOME=$JAVA_HOME/jre
    export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib
    export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
    

    环境变量生效,执行:

    source /etc/profile
    

    验证Java安装正确与否:

    [root@coordinator ~]# java -version
    java version "1.8.0_401"
    Java(TM) SE Runtime Environment (build 1.8.0_401-b10)
    Java HotSpot(TM) 64-Bit Server VM (build 25.401-b10, mixed mode)
    [root@coordinator ~]#
    
  • 2、所有主机都需要关闭防火墙

    systemctl stop firewalld
    systemctl disable firewalld
    
  • 3、所有主机都需要配置主机名映射关系 :vim /etc/hosts

    192.168.56.101 coordinator coordinator.openlookeng.com
    192.168.56.102 worker worker.openlookeng.com
    
  • 4、配置免密码登录(配置两两之间的免密码登录)
    所有的机器都需要产生一对密钥:公钥和私钥,执行如下命令:

    ssh-keygen -t rsa
    

    一直回车即可。当秘钥对生成后,所有主机需要执行如下命令:

    ssh-copy-id -i ~/.ssh/id_rsa.pub root@coordinator
    ssh-copy-id -i ~/.ssh/id_rsa.pub root@worker
    

    第一次执行时,需要输入root密码。

2.2.2 在协调节点coordinator上进行安装hadoop

  • 上传hadoop安装包/root目录下,解压:

    tar -zvxf /root/hadoop-2.7.7.tar.gz -C /opt/
    
  • 配置环境变量
    注意需要同时设置:coordinator和worker两个节点

    # hadoop
    export HADOOP_HOME=/opt/hadoop-2.7.7
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    
  • 创建tmp目录

    mkdir /opt/hadoop-2.7.7/tmp
    
  • 修改配置文件
    1)修改hadoop-env.sh文件

    vim /opt/hadoop-2.7.7/etc/hadoophadoop-env.sh
    

    设置JAVA_HOME的路径为本机jdk安装路径:
    export JAVA_HOME=/opt/jdk1.8.0_401
    在这里插入图片描述
    2)修改hdfs-site.xml文件

    vim /opt/hadoop-2.7.7/etc/hadoop/hdfs-site.xml
    

    添加如下信息:
    <configuration></configuration>之间添加

    <property>
     <name>dfs.replication</name>
     <value>1</value>
    </property>
    <property>
     <name>dfs.permissions</name>
     <value>false</value>
    </property>
    

    3)修改core-site.xml文件

    vim /opt/hadoop-2.7.7/etc/hadoop/core-site.xml
    

    添加如下信息:

    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://coordinator:9000</value>
     </property>
     <property>
            <name>hadoop.tmp.dir</name>
            <value>/opt/hadoop-2.7.7/tmp</value>
     </property>
     <property>
            <name>hadoop.proxyuser.root.hosts</name>
            <value>*</value>
     </property>
     <property>
            <name>hadoop.proxyuser.root.groups</name>
            <value>*</value>
     </property>
    

    4)修改mapper-site.xml文件

    vim /opt/hadoop-2.7.7/etc/hadoop/mapper-site.xml
    

    添加如下信息:

    <property>
    		<name>mapreduce.framework.name</name>
    		<value>yarn</value>
    </property>
    <!-- 历史服务器端地址

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1638296.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LabVIEW智能变电站监控系统设计与实现

LabVIEW智能变电站监控系统设计与实现 随着电力系统和智能化技术的快速发展&#xff0c;建立一个高效、可靠的变电站监控系统显得尤为重要。通过分析变电站监控系统的需求&#xff0c;设计了一个基于LabVIEW软件的监控平台。该平台利用虚拟仪器技术、传感器技术和无线传输技术…

从C到Py:Python的异常处理

本篇文章中我们将简单讲解一下有关Python中的异常处理&#xff0c;既有在代码中有显式表达的异常处理语法&#xff0c;还包括Pycharm手动调试的简单操作。 目录 Python异常处理 1、try-except结构 ​编辑 2、try-except-else结构 raise抛出异常 常见异常类型 Pycharm程序…

神经网络中常见的激活函数:理解与实践

神经网络中常见的激活函数&#xff1a;理解与实践 在神经网络中&#xff0c;激活函数是一个非常重要的组成部分&#xff0c;它为神经元引入了非线性特性&#xff0c;使得神经网络可以拟合各种复杂的函数关系。本文将介绍9种常见的激活函数&#xff0c;包括它们的概述、公式以及…

安卓中级控件(图形、选择按钮、文本输入、对话框)

图形定制 图形Drawable Android把所有能够显示的图形都抽象为Drawable类&#xff08;可绘制的&#xff09;。这里的图形不止是图片&#xff0c;还包括色块、画板、背景等。 包含图片在内的图形文件放在res目录的各个drawable目录下&#xff0c;其中drawable目录一般保存描述性…

相机知识的补充

一&#xff1a;镜头 1.1MP的概念 相机中MP的意思是指百万像素。MP是mega pixel的缩写。mega意为一百万&#xff0c;mega pixel 指意为100万像素。“像素”是相机感光器件上的感光最小单位。就像是光学相机的感光胶片的银粒一样&#xff0c;记忆在数码相机的“胶片”&#xff…

windows 驱动开发-DMA技术(二)

前面描述了DMA技术中适配器相关的部分以及DMA的分类&#xff0c;接下来看一下系统具体在支持两种DMA时候的操作的细微差别。 此处解释一下Scatter/Gather&#xff0c;这个也翻译为散点/收集&#xff0c;是指指示设备能够读取或写入内存中的任何区域&#xff0c;而不仅仅是特定…

YOLO系列改进,自研模块助力涨点

目录 一、原理 二、代码 三、添加到YOLOv5中 一、原理 论文地址:

LiveCD镜像文件的定制化

最近想要定制化一款属于自己的LiveCD镜像文件&#xff0c;并且里边封装好所需要的软件程序&#xff0c;本文将会记录具体的操作步骤&#xff0c;供有需要的人参考借鉴。 环境说明&#xff1a; 环境配置说明配置参数编码环境Centos7.9LiveCD文件CentOS-7-livecd-x86_64.iso 附…

袁庭新ES系列18节|Spring Data Elasticsearch高级

前言 这一章节袁老师将带领同学们来学习Spring Data Elasticsearch高级操作相关的内容。我们继续来探索SDE是如何将原始操作Elasticsearch的客户端API进行封装的&#xff0c;以及通过Spring Data Elasticsearch如何来操作ES。准备好了吗&#xff1f;我们继续来探索ES的内容。 …

探索AI工具的巅峰:个人体验与深度剖析

✨✨ 欢迎大家来访Srlua的博文&#xff08;づ&#xffe3;3&#xffe3;&#xff09;づ╭❤&#xff5e;✨✨ &#x1f31f;&#x1f31f; 欢迎各位亲爱的读者&#xff0c;感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢&#xff0c;在这里我会分享我的知识和经验。&am…

【Go语言快速上手(六)】管道, 网络编程,反射,用法讲解

&#x1f493;博主CSDN主页:杭电码农-NEO&#x1f493;   ⏩专栏分类:Go语言专栏⏪   &#x1f69a;代码仓库:NEO的学习日记&#x1f69a;   &#x1f339;关注我&#x1faf5;带你学习更多Go语言知识   &#x1f51d;&#x1f51d; GO快速上手 1. 前言2. 初识管道3. 管…

自定义SpringBoot的starter

案例需求&#xff1a;自定义redis-stater。要求当导入redis坐标时&#xff0c;SpringBoot自动创建Jedis的Bean。 实现步骤&#xff1a; 1、创建redis-spring-boot-autoconfigure模块 2、创建redis-spring-boot-starter模块&#xff0c;依赖redis-spring-boot-autoconfigure的…

Codeforces Round 938 (Div. 3)H-The Most Reckless Defense

来源 题目 You are playing a very popular Tower Defense game called "Runnerfield 2". In this game, the player sets up defensive towers that attack enemies moving from a certain starting point to the players base. You are given a grid of size nm&a…

Delta lake with Java--利用spark sql操作数据2

上一篇文章尝试了建库&#xff0c;建表&#xff0c;插入数据&#xff0c;还差删除和更新&#xff0c;所以在这篇文章补充一下&#xff0c;代码很简单&#xff0c;具体如下&#xff1a; import org.apache.spark.sql.SaveMode; import org.apache.spark.sql.SparkSession;publi…

DRF中的请求入口分析及request对象分析

DRF中的请求入口分析及request对象分析 django restframework框架是在django的基础上又给我们提供了很多方便的功能&#xff0c;让我们可以更便捷基于django开发restful API 1 drf项目 pip install django pip install djangorestframework1.1 核心配置 INSTALLED_APPS [d…

【源码阅读】Golang中的go-sql-driver库源码探究

文章目录 前言一、go-sql-driver/mysql1、驱动注册&#xff1a;sql.Register2、驱动实现&#xff1a;MysqlDriver3、RegisterDialContext 二、总结 前言 在上篇文章中我们知道&#xff0c;database/sql只是提供了驱动相关的接口&#xff0c;并没有相关的具体实现&#xff0c;具…

PG数据库结构与oracle比较

1.数据库集簇逻辑结构 数据库集簇概念&#xff1a;一个大的数据库是由若干个小的数据库组成&#xff0c;实现数据的隔离存放&#xff0c;在概念上应该是与mysql一样的 在mysql中可以用show database列出数据库 PG中用\l 数据库对象存放在数据库中&#xff1a; PG中的所有数据…

Mac 上安装多版本的 JDK 且实现 自由切换

背景 当前电脑上已经安装了 jdk8; 现在再安装 jdk17。 期望 完成 jdk17 的安装&#xff0c;并且完成 环境变量 的配置&#xff0c;实现自由切换。 前置补充知识 jdk 的安装路径 可以通过查看以下目录中的内容&#xff0c;确认当前已经安装的 jdk 版本。 cd /Library/Java/Java…

Maven3.9.6下载安装教程

(/≧▽≦)/~┴┴ 嗨~我叫小奥 ✨✨✨ &#x1f440;&#x1f440;&#x1f440; 个人博客&#xff1a;小奥的博客 &#x1f44d;&#x1f44d;&#x1f44d;&#xff1a;个人CSDN ⭐️⭐️⭐️&#xff1a;Github传送门 &#x1f379; 本人24应届生一枚&#xff0c;技术和水平有…

Typescript精进:前端必备的5大技巧(AI写作)

首先&#xff0c;这篇文章是基于笔尖AI写作进行文章创作的&#xff0c;喜欢的宝子&#xff0c;也可以去体验下&#xff0c;解放双手&#xff0c;上班直接摸鱼~ 按照惯例&#xff0c;先介绍下这款笔尖AI写作&#xff0c;宝子也可以直接下滑跳过看正文~ 笔尖Ai写作&#xff1a;…