Spark 连接 Hive

news2025/9/19 6:20:18

导包

修改配置文件

修改hive-site.xml文件

启动hadoop

启动hive

启动spark

测试

查看表

导包

spark连接hive需要六个关键的jar包，以及将hive的配置文件hive-site.xml拷贝到spark的conf目录下。如果你hive配置没问题的话，这些jar都在hive的目录中。

将jar包导入到 opt/soft/spark312/jars/

[root@hadoop3 jars]# cp /opt/soft/hive312/lib/hive-beeline-3.1.2.jar ./
[root@hadoop3 jars]# cp /opt/soft/hive312/lib/hive-cli-3.1.2.jar ./
[root@hadoop3 jars]# cp /opt/soft/hive312/lib/hive-exec-3.1.2.jar ./
[root@hadoop3 jars]# cp /opt/soft/hive312/lib/hive-jdbc-3.1.2.jar ./
[root@hadoop3 jars]# cp /opt/soft/hive312/lib/hive-metastore-3.1.2.jar ./
[root@hadoop3 jars]# cp /opt/soft/hive312/lib/mysql-connector-java-8.0.25.jar ./

修改配置文件

切换目录

[root@hadoop3 /]# cd opt/soft/spark312/conf/

把hive312/conf中的hive-site.xml复制到spark312/conf目录下

[root@hadoop3 conf]# cp /opt/soft/hive312/conf/hive-site.xml ./

修改hive-site.xml文件

检查少什么，少则添加

<configuration>
  <property>
    <name>hive.metastore.warehouse.dir</name>
    <value>/opt/soft/hive312/warehouse</value>
  </property>
  <property>
    <name>hive.metastore.db.type</name>
    <value>mysql</value>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://192.168.152.184:3306/hiveone?createDatabaseIfNotExist=true</value>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.cj.jdbc.Driver</value>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>root</value>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>123456</value>
  </property>
  <property>
    <name>hive.metastore.schema.verification</name>
    <value>false</value>
        <description>关闭schema验证</description>
  </property>
  <property>
    <name>hive.cli.print.current.db</name>
    <value>true</value>
        <description>提示当前数据库名</description>
  </property>
  <property>
    <name>hive.cli.print.header</name>
    <value>true</value>
        <description>查询输出时带列名一起输出</description>
  </property>
<property>
      <name>hive.zookeeper.quorum</name>
      <value>192.168.152.192</value>
   </property>
    <property>
      <name>hbase.zookeeper.quorum</name>
      <value>192.168.152.192</value>

</property>
    <property>
      <name>hbase.zookeeper.quorum</name>
      <value>192.168.152.192</value>
   </property>

    <property>
      <name>hive.aux.jars.path</name>
      <value>file:///opt/soft/hive312/lib/hive-hbase-handler-3.1.2.jar,file:///opt/soft/hive312/lib/zookeeper-3.4.6.jar,file:///opt/soft/hive312/lib/hbase-client-2.3.5.jar,file:///opt/soft/hive312/lib/hbase-common-2.3.5-tests.jar,file:///opt/soft/hive312/lib/hbase-server-2.3.5.jar,file:///opt/soft/hive312/lib/hbase-common-2.3.5.jar,file:///opt/soft/hive312/lib/hbase-protocol-2.3.5.jar,file:///opt/soft/hive312/lib/htrace-core-3.2.0-incubating.jar</value>
</property>
<property>
  <name>hadoop.proxyuser.hadoop.hosts</name>
  <value>*</value>
</property>

<property>
  <name>hadoop.proxyuser.hdfs.groups</name>
  <value>*</value>
</property>
<property>
  <name>hive.metastore.uris</name>
  <value>thrift://192.168.152.192:9083</value>
</property>

</configuration>

配置完成，下面开始测试

启动hadoop

[root@gree2 ~]# start-all.sh

启动hive

nohup hive --service metastore &

nohup hive --service hiveserver2 &

beeline -u jdbc:hive2://192.168.152.192:10000

启动spark

spark-shell

测试

查看表

scala> spark.table("aa")

这里的aa为hive默认库default下面的数据表

使用 spark.sql

scala> spark.sql("use default")
scala> spark.sql("select * from aa")

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/419172.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Spark 连接 Hive

导包

修改配置文件

修改hive-site.xml文件

启动hadoop

启动hive

启动spark

测试

查看表

相关文章

Spring Security实战（四）—— 会话管理

cuSPARSE官方程序示例

阿里本地生活再出发：口碑入高德，备战美团、抖音

网络软件-管理网络设备和组件

一个简单的MUX-VLAN实验（华为eNSP模拟器）

python贪吃蛇代码

绿联dx4600砖机救援

Vue源码解析（尚硅谷）

3.7.2数据库系统-数据库控制技术：数据库的安全性、数据库备份与恢复技术、数据备份、数据库故障与恢复、数据库性能优化

集合的线程安全解读

100Wqps异地多活，得物是怎么架构的？

大专毕业该怎么办？

黑马在线教育数仓实战5

国货之光！打工人必装的8个软件，你都用过没？|办公|效率|创作

Vue.js 2.0 表单控件绑定

商品库存管理系统【GUI/Swing+MySQL】（Java课设）

用户信息、账号设置。换做是你会怎么做代码实现？

零入门kubernetes网络实战-28-＞在同一个宿主机上基于虚拟网桥bridge链接同网段的不同网络命名空间的通信方案

互联网+医疗|如何满足各项安全合规要求

SDUT操作系统课程（CAST）专题二+专题四参考总结