大数据学习：Hive安装部署

news2026/2/12 23:27:58

Hive的安装部署

注意hive就是一个构建数据仓库的工具，只需要在一台服务器上安装就可以了，不需要在多台服务器上安装。

此处以安装到node03为例；请大家保持统一

使用hadoop普通用户操作

1.1 先决条件

搭建好三节点Hadoop集群；
node03上先安装好MySQL服务；

1.2 准备安装包

下载hive的安装包
- http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.14.2.tar.gz
规划安装目录
- /opt/install
上传安装包到node03服务器中的/opt/soft路径下

1.3 解压

解压安装包到指定的规划目录/opt/install

  [hadoop@node03 ~]$ cd /opt/soft/
  [hadoop@node03 soft]$ tar -xzvf hive-1.1.0-cdh5.14.2.tar.gz -C /opt/install/

1.4 修改配置文件

修改配置文件hive-env.sh

进入到Hive的安装目录下的conf文件夹中

[hadoop@node03 soft]$ cd /opt/install/hive-1.1.0-cdh5.14.2/conf/

重命名hive-env.sh.template

[hadoop@node03 conf]$ mv hive-env.sh.template hive-env.sh

修改hive-env.sh

[hadoop@node03 conf]$ vim hive-env.sh

如下，修改此文件中HADOOP_HOME、HIVE_CONF_DIR的值（根据自己机器的实际情况配置）

#配置HADOOP_HOME路径
export HADOOP_HOME=/opt/install/hadoop-2.6.0-cdh5.14.2/

#配置HIVE_CONF_DIR路径
export HIVE_CONF_DIR=/opt/install/hive-1.1.0-cdh5.14.2/conf

注意：HADOOP_HOME前要手动加上export关键字

修改配置文件hive-site.xml

conf目录下默认没有此文件，vim创建即可

[hadoop@node03 conf]$ vim hive-site.xml

文件内容如下

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
        <property>
                <name>javax.jdo.option.ConnectionURL</name>
                <value>jdbc:mysql://node03:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=latin1&amp;useSSL=false</value>
        </property>

        <property>
                <name>javax.jdo.option.ConnectionDriverName</name>
                <value>com.mysql.jdbc.Driver</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionUserName</name>
                <value>root</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionPassword</name>
                <value>123456</value>
        </property>
        <property>
                <name>hive.cli.print.current.db</name>
                <value>true</value>
        </property>
        <property>
                <name>hive.cli.print.header</name>
            <value>true</value>
        </property>
    	<property>
                <name>hive.server2.thrift.bind.host</name>
                <value>node03</value>
        </property>
</configuration>

修改日志配置文件hive-log4j.properties

[hadoop@node03 conf]$ mkdir -p /opt/install/hive-1.1.0-cdh5.14.2/logs/

重命名生成文件hive-log4j.properties

[hadoop@node03 conf]$ pwd
/opt/install/hive-1.1.0-cdh5.14.2/conf
[hadoop@node03 conf]$ mv hive-log4j.properties.template hive-log4j.properties
[hadoop@node03 conf]$ vim hive-log4j.properties # 修改文件

修改此文件的hive.log.dir属性的值

    #更改以下内容，设置我们的hive的日志文件存放的路径，便于排查问题
    hive.log.dir=/opt/install/hive-1.1.0-cdh5.14.2/logs/

1.5 拷贝mysql驱动包

上传mysql驱动包，如mysql-connector-java-5.1.38.jar到/opt/soft目录中
由于运行hive时，需要向mysql数据库中读写元数据，所以需要将mysql的驱动包上传到hive的lib目录下

[hadoop@node03 ~]$ cd /opt/soft/
[hadoop@node03 soft]$ cp mysql-connector-java-5.1.38.jar /opt/install/hive-1.1.0-cdh5.14.2/lib/

1.6 配置Hive环境变量

切换到root用户下

[hadoop@node03 soft]$ su root
Password:

打开/etc/profile文件

[root@node03 soft]# vim /etc/profile

末尾添加如下内容

export HIVE_HOME=/opt/install/hive-1.1.0-cdh5.14.2
export PATH=$PATH:$HIVE_HOME/bin

切换回hadoop用户，并source

[root@node03 soft]# su hadoop
[hadoop@node03 soft]$ source /etc/profile

1.7 验证安装

hadoop集群已启动
mysql服务已启动
在node03上任意目录启动hive cli命令行客户端

[hadoop@node03 ~]$ hive

查看有哪些数据库

show databases;

说明hive安装成功
退出cli

quit;

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/953914.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

大数据学习：Hive安装部署

Hive的安装部署

1.1 先决条件

1.2 准备安装包

1.3 解压

1.4 修改配置文件

1.5 拷贝mysql驱动包

1.6 配置Hive环境变量

1.7 验证安装

相关文章

十六、策略模式

Python+turtle实现一个乌龟逃跑小游戏(可以和孩子一起完成)

计算机视觉的应用12-卷积神经网络中图像特征提取的可视化研究，让大家理解特征提取的全过程

(数学) 剑指 Offer 39. 数组中出现次数超过一半的数字 ——【Leetcode每日一题】

echarts图表静态数据象形柱形图、折线图、日历饼图、饼状图四种实现

学习ros机器人导航从精读nav2导航launch文件开始

一文了解什么是同源策略

C++ 手写实现类似lower_bound和upper_bound的二分功能

11、监测数据采集物联网应用开发步骤(8.2)

ATA-1222A宽带放大器的电子实验案例（案例合集）

远程访问Linux的DataEase数据可视化分析，有哪些推荐的工具？

Densenet模型详解

数据可视化工具中的显眼包：奥威BI自带方案上阵

(AcWing) spfa求最短路

indexDb使用

企业智能知识管理在线工具语雀、helplook、石墨文档、Baklib怎么样？

Java对接海康威视（二次开发）组织信息、人员信息等

抽象又有点垃圾的JavaScript

微力同步私人网盘部署教程：利用端口映射实现远程访问的解决方案

ReID网络：MGN网络(4) - Loss计算