大数据之搭建Hive组件

news2025/1/13 12:00:47

声明:所有软件自行下载,并存放到统一目录中

1.Hive组件的安装配置

1.1实验环境

服务器集群3 个以上节点,节点间网络互通,各节点最低配置:双核 CPU、8GB 内存、100G 硬盘
运行环境CentOS 7.4
服务和组件完成前面章节实验,其他服务及组件根据实验需求安装

1.2下载和解压安装文件

1.2.1基础环境和安装准备

Hive 组件需要基于 Hadoop 系统进行安装。因此,在安装 Hive 组件前,需要确保 Hadoop 系统能够正常运行。本章节内容是基于之前已部署完毕的 Hadoop 全分布系统,在 master 节点上实现 Hive 组件安装。 Hive 组件的部署规划和软件包路径如下:

(1)当前环境中已安装 Hadoop 全分布系统。

(2)本地安装 MySQL 数据库(账号 root,密码 Password123$), 软件包在/opt/software/mysql-5.7.18 路径下。

(3)MySQL 端口号(3306)。

(4)MySQL 的 JDBC 驱动包/opt/software/mysql-connector-java-5.1.47.jar, 在此基础上更新 Hive 元数据存储。 (5)Hive 软件包/opt/software/apache-hive-2.0.0-bin.tar.gz。

1.2.2解压安装文件

(1)使用 root 用户,将 Hive 安装包 /opt/software/apache-hive-2.0.0-bin.tar.gz 路解压到/usr/local/src 路径下。

[root@master ~]# tar -zxvf /opt/software/apache-hive-2.0.0-bin.tar.gz -C 
/usr/local/src 
#进入该目录查看是否正确解压到该路径

[root@master ~]# cd /usr/local/src/
[root@master src]# ls

(2)将解压后的 apache-hive-2.0.0-bin 文件夹更名为 hive

[root@master src]# mv /usr/local/src/apache-hive-2.0.0-bin /usr/local/src/hive

(3)修改 hive 目录归属用户和用户组为 hadoop

[root@master ~]# chown -R hadoop:hadoop /usr/local/src/hive

1.3设置 Hive 环境

1.3.1卸载 MariaDB 数据库

Hive 元数据存储在 MySQL 数据库中,因此在部署 Hive 组件前需要首先在 Linux 系统 下安装 MySQL 数据库,并进行 MySQL 字符集、安全初始化、远程访问权限等相关配置。需 要使用 root 用户登录,执行如下操作步骤:

(1)关闭 Linux 系统防火墙,并将防火墙设定为系统开机并不自动启动。

# 关闭防火墙服务 
[root@master ~]# systemctl stop firewalld 
 
# 设置防火墙服务开机不启动 
[root@master ~]# systemctl disable firewalld

 (2)卸载 Linux 系统自带的 MariaDB。

         1)首先查看 Linux 系统中 MariaDB 的安装情况。

# 查询已安装的 mariadb 软件包 
[root@ master ~]# rpm -qa | grep mariadb
mariadb-libs-5.5.68-1.el7.x86_64
#注意这里的软件包的版本可能每个人的不一样

以上结果显示 Linux 系统中已经按照了 mariadb-libs-5.5.68-1.el7.x86_64 软件包, 需要将其卸载。

        2)卸载 MariaDB 软件包

# 卸载 mariadb 软件包 
[root@master ~]# rpm -e --nodeps mariadb-libs-5.5.68-1.el7.x86_64

1.3.2安装 MySQL 数据库

(1)按如下顺序依次按照 MySQL 数据库的 mysql common、mysql libs、mysql client 软件包

# MySQL 软件包路径 
[root@master ~]# cd /opt/software/mysql-5.7.18/ 
 
[root@master ~]# rpm -ivh mysql-community-common-5.7.18-1.el7.x86_64.rpm

[root@master ~]# rpm -ivh mysql-community-libs-5.7.18-1.el7.x86_64.rpm 
 
[root@master ~]# rpm -ivh mysql-community-client-5.7.18-1.el7.x86_64.rpm

(2)安装 mysql server 软件包

[root@master ~]# rpm -ivh mysql-community-server-5.7.18-1.el7.x86_64.rpm

(3)修改 MySQL 数据库配置,在/etc/my.cnf 文件中添加如表 6-1 所示的 MySQL 数据 库配置项。

字段匹配值字段说明
default-storage-engineinnodb设置 innodb 为默认的存储引擎
innodb_file_per_table

设置每个表的数据单独保存,而不是统一保存在 innodb 系统表空间中。单独保存有方便管理和提 升性能两方面优势

collation-serverutf8_general_ci设置支持中文编码字符集
init-connect'SET NAMES utf8'设置用户登录到数据库之后,在执行第一次查询之 前执行 SET NAMES utf8 命令,将使用的字符编码 设定为 utf8
character-set-serverutf8将 MySQL 服务器字符集设定为 utf8

将以下配置信息添加到/etc/my.cnf 文件 symbolic-links=0 配置信息的下方。

default-storage-engine=innodb 
innodb_file_per_table 
collation-server=utf8_general_ci 
init-connect='SET NAMES utf8' 
character-set-server=utf8

(4)启动 MySQL 数据库。

[root@master ~]# systemctl start mysqld

 (5)查询 MySQL 数据库状态。mysqld 进程状态为 active (running),则表示 MySQL 数 据库正常运行。 如果 mysqld 进程状态为 failed,则表示 MySQL 数据库启动异常。此时需要排查 /etc/my.cnf 文件

[root@master ~]# systemctl status mysqld

(6)查询 MySQL 数据库默认密码。 MySQL 数据库安装后的默认密码保存在/var/log/mysqld.log 文件中,在该文件中以 password 关键字搜索默认密码

[root@master ~]# cat /var/log/mysqld.log | grep password
2024-03-22T14:30:57.837179Z 1 [Note] A temporary password is generated for root@localhost: #默认密码 ccaVl9A<V,.% 

MySQL 数据库是安装后随机生成的,所以每次安装后生成的默认密码不相同

(7)MySQL 数据库初始化。 执行 mysql_secure_installation 命令初始化 MySQL 数据库,初始化过程中需要设定 数据库 root 用户登录密码,密码需符合安全规则,包括大小写字符、数字和特殊符号, 可设定密码为 Password123$。

在进行 MySQL 数据库初始化过程中会出现以下交互确认信息:

Enter password for user root: # 输入/var/log/mysqld.log 文件中查询
到的默认 root 用户登录密码 
The 'validate_password' plugin is installed on the server. 
The subsequent steps will run with the existing configuration 
of the plugin. 
Using existing password for root. 
 
Estimated strength of the password: 100 
Change the password for root ? ((Press y|Y for Yes, any other 
key for No) : y 
 
New password: # 输入新密码 Password123$ 
 
Re-enter new password: # 再次输入新密码 Password123$ 
 
Estimated strength of the password: 100 
Do you wish to continue with the password provided?(Press y|Y 
for Yes, any other key for No) : y # 输入 y 
By default, a MySQL installation has an anonymous user, 
allowing anyone to log into MySQL without having to have 
a user account created for them. This is intended only for 
testing, and to make the installation go a bit smoother. 
You should remove them before moving into a production 
environment. 
 
Remove anonymous users? (Press y|Y for Yes, any other key for 
No) : y # 输入 y 
Success. 
 
 
Normally, root should only be allowed to connect from 
'localhost'. This ensures that someone cannot guess at 
the root password from the network. 
 
Disallow root login remotely? (Press y|Y for Yes, any other key 
for No) : n # 输入 n 
 
 ... skipping. 
By default, MySQL comes with a database named 'test' that 
anyone can access. This is also intended only for testing, 
and should be removed before moving into a production 
environment. 
 
 
Remove test database and access to it? (Press y|Y for Yes, any 
other key for No) : y # 输入 y 
 - Dropping test database... 
Success. 
 
 - Removing privileges on test database... 
Success.
Reloading the privilege tables will ensure that all changes 
made so far will take effect immediately. 
 
Reload privilege tables now? (Press y|Y for Yes, any other key 
for No) : y # 输入 y 
Success. 
 
All done! 

(8)添加 root 用户从本地和远程访问 MySQL 数据库表单的授权。

[root@master ~]# mysql -uroot -pPassword123$
mysql: [Warning] Using a password on the command line interface can be insecure.
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 6
Server version: 5.7.18 MySQL Community Server (GPL)

Copyright (c) 2000, 2017, Oracle and/or its affiliates. All rights reserved.

Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

mysql> grant all privileges on *.* to root@'localhost' identified by 'Password123$';
Query OK, 0 rows affected, 1 warning (0.00 sec) # 添加 root 用户本地访问授权

mysql> grant all privileges on *.* to root@'%' identified by 'Password123$';
Query OK, 0 rows affected, 1 warning (0.00 sec) # 添加 root 用户远程访问授权

mysql> flush privileges; # 刷新授权
Query OK, 0 rows affected (0.01 sec)

mysql> select user,host from mysql.user where user='root'; # 查询 root 用户授权情况
+------+-----------+
| user | host      |
+------+-----------+
| root | %         |
| root | localhost |
+------+-----------+
2 rows in set (0.00 sec)
mysql> exit #退出
Bye
[root@master ~]#


1.3.3配置 Hive 组件

(1)设置 Hive 环境变量并使其生效。

# 在文件末尾追加以下配置内容 
[root@master ~]# vi /etc/profile 
 
# set hive environment 
export HIVE_HOME=/usr/local/src/hive 
export PATH=$PATH:$HIVE_HOME/bin 
 
# 使环境变量配置生效 
[root@master ~]# source /etc/profile

 

 (2)修改 Hive 组件配置文件。 切换到 hadoop 用户执行以下对 Hive 组件的配置操作。 将/usr/local/src/hive/conf 文件夹下 hive-default.xml.template 文件,更名为 hive-site.xml。

[root@master ~]# su - hadoop 
 
[hadoop@master ~]$ cp /usr/local/src/hive/conf/hive-default.xml.template 
/usr/local/src/hive/conf/hive-site.xml

(3)通过 vi 编辑器修改 hive-site.xml 文件实现 Hive 连接 MySQL 数据库,并设定 Hive 临时文件存储路径

[hadoop@master ~]$ vi /usr/local/src/hive/conf/hive-site.xml

1)设置 MySQL 数据库连接

<name>javax.jdo.option.ConnectionURL</name> 
<value>jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true&amp;useSSL=false</value> 
<description>JDBC connect string for a JDBC metastore</description>

2)配置 MySQL 数据库 root 的密码

<property> 
<name>javax.jdo.option.ConnectionPassword</name> 
<value>Password123$</value> 
<description>password to use against s database</description> 
</property>

3)验证元数据存储版本一致性。若默认 false,则不用修改

<property> 
<name>hive.metastore.schema.verification</name> 
<value>false</value> 
<description> 
 Enforce metastore schema version consistency. 
True: Verify that version information stored in is compatible with one from 
Hive jars. Also disable automatic 
 False: Warn if the version information stored in metastore doesn't match 
with one from in Hive jars. 
</description> 
</property>

4)配置数据库驱动

<property> 
<name>javax.jdo.option.ConnectionDriverName</name> 
<value>com.mysql.jdbc.Driver</value> 
<description>Driver class name for a JDBC metastore</description> 
</property>

5)配置数据库用户名 javax.jdo.option.ConnectionUserName 为 root

<property> 
<name>javax.jdo.option.ConnectionUserName</name> 
<value>root</value> 
<description>Username to use against metastore database</description> 
</property>

6 ) 将 以 下 位 置 的 ${system:java.io.tmpdir}/${system:user.name} 替 换 为 “/usr/local/src/hive/tmp”目录及其子目录

需要替换以下 4 处配置内容:

<name>hive.querylog.location</name> 
 <value>/usr/local/src/hive/tmp</value> 
 <description>Location of Hive run time structured log file</description> 
 
 <name>hive.exec.local.scratchdir</name> 
 <value>/usr/local/src/hive/tmp</value> 
 
 <name>hive.downloaded.resources.dir</name> 
 <value>/usr/local/src/hive/tmp/resources</value> 
 
 <name>hive.server2.logging.operation.log.location</name> 
 <value>/usr/local/src/hive/tmp/operation_logs</value>

7)在 Hive 安装目录中创建临时文件夹 tmp。

[hadoop@master ~]$ mkdir /usr/local/src/hive/tmp

至此,Hive 组件安装和配置完成。

1.3.4初始化 hive 元数据

1)将 MySQL 数据库驱动(/opt/software/mysql-connector-java-5.1.46.jar)拷贝到 Hive 安装目录的 lib 下:

[hadoop@master ~]$ cp /opt/software/mysql-connector-java-5.1.46.jar 
/usr/local/src/hive/lib/

2)重新启动 hadooop 即可

[hadoop@master lib]$ stop-all.sh 
 
[hadoop@master lib]$ start-all.sh

3)初始化数据库

[hadoop@master ~]$schematool -initSchema -dbType mysql

 

4)启动 hive

[hadoop@master ~]$ hive

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1578125.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

redis的简单操作

redis中string的操作 安装 下载可视化软件&#xff1a;https://gitee.com/qishibo/AnotherRedisDesktopManager/releases。 Mac安装redis&#xff1a; brew install redisWindows安装redis: 安装包下载地址&#xff1a;https://github.com/tporadowski/redis/releases 1.…

内存管理new and delete(C++)

在本篇中&#xff0c;将会较为详细的介绍在 Cpp 中的两个新操作符 new 和 delete&#xff0c;将会介绍其中的底层原理&#xff0c;以及这两个操作符的使用方法。其中还介绍了 new/delete 操作符使用的细节&#xff0c;还扩展了一些有关定位 new 表达式的知识点。最后总结了 mal…

C++练级之路——类和对象(上)

1、类的定义 class 类名{//成员函数 //成员变量}; class为定义的关键字&#xff0c;{ }内是类的主体&#xff0c;注意后面的 ; 不要忘了 类体中的内容成为类的成员&#xff0c;类中的变量为成员变量或类的属性&#xff0c;类中的函数为成员函数或类的方法&#xff0c; 类的两种…

Prompt最佳实践|大模型也喜欢角色扮演?

在OpenAI的官方文档中已经提供了Prompt Enginerring的最佳实践&#xff0c;目的就是帮助用户更好的使用ChatGPT 编写优秀的提示词我一共总结了9个分类&#xff0c;本文讲解第2个分类&#xff1a;要求模型扮演角色 提供更多的细节要求模型扮演角色使用分隔符指定任务步骤提供样…

OPC UA遇见chatGPT

最近opc 基金会将召开一个会议&#xff0c;主题是”OPC UA meets IT“。由此可见&#xff0c;工业自动化行业也开始研究和评估chatGPT带来的影响了。 本文谈谈本人对OPC UA 与chatGPT结合的初步实验和思考。 构建OPC UA 信息模型 chatGPT 的确非常强大了&#xff0c;使用自然…

前端开发之el-table(vue2中)固定列fixed滚动条被固定列盖住

固定列fixed滚动条被固定列盖住 效果图前言解决方案 效果图 前言 在使用fixed固定列的时候会出现滚动条被盖住的情况 解决方案 改变el-table固定列的计算高度即可 .el-table {.el-table__fixed-right,.el-table__fixed {height:auto !important;bottom:15px !important;}}

安装cuda后只在root用户下可见,非root不可见问题

0. 安装cuda和nvidia driver步骤可以参考这篇&#xff1a; https://blog.csdn.net/mygugu/article/details/137474101?spm1001.2014.3001.5502 1.问题记录&#xff1a; 这里记录下安装cuda后遇到的一个奇葩问题&#xff0c;因为安装过程需要root权限&#xff0c;安装后发现…

k8s部署efk

环境简介&#xff1a; kubernetes: v1.22.2 helm&#xff1a; v3.12.0 elasticsearch&#xff1a; 8.8.0 chart包&#xff1a;19.10.0 fluentd: 1.16.2 chart包&#xff1a; 5.9.4 kibana: 8.2.2 chart包&#xff1a;10.1.9 整体架构图&#xff1a; 一、Elasticsearch安装…

Git入门实战教程之创建版本库

一、Git简介 Git是一个分布式版本控制系&#xff0c;分层结构如下&#xff1a; Git分为四层&#xff1a; 1、工作目录 当前正在工作的项目的实际文件目录&#xff0c;我们执行命令git init时所在的地方&#xff0c;也就是我们执行一切文件操作的地方。 2、暂存区 暂存区是…

字符串2s总结

4.字符串 字符串理论基础 什么是字符串 字符串是若⼲字符组成的有限序列&#xff0c;也可以理解为是⼀个字符数组&#xff0c;但是很多语⾔对字符串做了特殊的规定&#xff0c;接下来我来说⼀说C/C中的字符串。 在C语⾔中&#xff0c;把⼀个字符串存⼊⼀个数组时&#xff0c…

前端开发学习笔记 3 (Chrome浏览器调试工具、Emmet语法、CSS复合选择器、CSS元素选择模式、CSS背景)

文章目录 Chrome浏览器调试工具Emmet语法CSS复合选择器后代选择器子选择器并集选择器伪类选择器 CSS元素选择模式元素选择模式概述CSS块标签CSS行内标签CSS行内块标签CSS元素显示模式转换 CSS背景CSS背景颜色CSS背景图片CSS背景图片平铺CSS背景图片位置CSS背景图片固定CSS背景复…

如何高效学习Python编程语言

理解Python的应用场景 不同的编程语言有不同的发展历史和应用场景,了解Python主要应用在哪些领域对于学习它会有很大帮助。Python最初是一种通用脚本语言,主要用于系统级任务自动化。随着时间的推移,它逐步成为数据处理、科学计算、Web开发、自动化运维等众多领域的主要编程语…

第4章 Redis,一站式高性能存储方案,笔记问题

点赞具体要实现功能有哪些&#xff1f; 可以点赞的地方&#xff1a;对帖子点赞&#xff0c;对评论点赞点一次是点赞&#xff0c;再点一次是取消赞统计点赞的数量&#xff08;计数&#xff0c;string&#xff09;&#xff0c;帖子被点赞的数量&#xff0c;某个用户被点赞的数量…

8.java openCV4.x 入门-Mat之多维元组(Tuple)

专栏简介 &#x1f492;个人主页 &#x1f4f0;专栏目录 点击上方查看更多内容 &#x1f4d6;心灵鸡汤&#x1f4d6;我们唯一拥有的就是今天&#xff0c;唯一能把握的也是今天建议把本文当作笔记来看&#xff0c;据说专栏目录里面有相应视频&#x1f92b; &#x1f9ed;文…

【深度学习基础】

打基础日常记录 CNN基础知识1. 感知机2. DNN 深度神经网络&#xff08;全连接神经网络&#xff09;DNN 与感知机的区别DNN特点&#xff0c;全连接神经网络DNN前向传播和反向传播 3. CNN结构【提取特征分类】4. CNN应用于文本 RNN基础1. RNN的本质 词向量模型word2Vec1. 自然语言…

CentOS系统的小小基础

CentOS系统的小小基础 1、基础命令查看系统查看显存 2、常见问题创建文件后出现 E325: ATTENTION Found a swap file by the name ".文件名.swp"自己创建了方便的脚本共所有用户使用yum换源清楚僵尸进程 Linux 使用Anacondapip换源下载安装 NVIDIA Driver 1、基础命令…

语音特征的反应——语谱图

语谱图的横坐标为时间&#xff0c;纵坐标为对应时间点的频率。坐标中的每个点用不同颜色表示&#xff0c;颜色越亮表示频率越大&#xff0c;颜色越淡表示频率越小。可以说语谱图是一个在二维平面展示三维信息的图,既能够表示频率信息,又能够表示时间信息。 创建和绘制语谱图的…

加州大学欧文分校英语基础语法专项课程02:Questions, Present Progressive and Future Tenses 学习笔记

Questions, Present Progressive and Future Tenses Course Certificate 本文是学习 Questions, Present Progressive and Future Tenses 这门课的学习笔记&#xff0c;如有侵权&#xff0c;请联系删除。 文章目录 Questions, Present Progressive and Future TensesWeek 01: …

边缘智能网关为企业数字化转型提供强有力支持-天拓四方

一、企业背景 随着信息技术的飞速发展&#xff0c;企业对于数据处理和通信的需求日益增长。特别是在工业4.0、智能制造等领域&#xff0c;企业面临着海量的数据采集、实时分析、远程监控等挑战。传统的中心化数据处理模式已难以满足这些需求&#xff0c;企业需要寻求一种更加高…

JavaScript - 你知道Ajax的原理吗?如何封装一个Ajax

难度级别:中高级及以上 提问概率:75% 想要实现Ajax,就需要创建它的核心通信对象XMLHttpRequest,通过核心对象的open方法与服务端建立连接,核心对象的send方法可以将请求所需数据发送给服务端,服务端接收到请求并做出响应,我们通过核心对象…