Sqoop初认识及安装

news2024/9/30 13:28:13

Sqoop初认识及安装


文章目录

  • Sqoop初认识及安装
    • Sqoop简介
    • Sqoop原理
    • 安装
      • 前置条件
      • 镜像地址
      • 上传安装包
      • 解压
      • 修改配置文件
        • 重命名配置文件
      • 拷贝JDBC驱动
      • 验证Sqoop
      • 测试Sqoop是否能够成功连接数据库


Sqoop简介

Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop独立成为一个Apache项目。

Sqoop2的最新版本是1.99.7。

请注意,2与1不兼容,且功能也不完整,它并不打算用于生产部署。

Sqoop原理

  • 将导入或导出命令翻译成mapreduce程序来实现。
  • 在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。

安装

前置条件

安装Sqoop的前提是已经具备Java和Hadoop的环境。

镜像地址

https://archive.apache.org/dist/sqoop/

安装V1.4.6或者V1.4.7均可,本文演示的是V1.4.6版本的安装

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JzgEXR64-1676182319878)(1.png)]

如下图所示,选择下载sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 即框选的tar包,此处的选择是下载带有Hadoop依赖的sqoop安装包

在这里插入图片描述

上传安装包

上传安装包sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz到虚拟机中

解压

  • 解压sqoop安装包到指定目录,如:
[whybigdata@node01 software]# tar -zxf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt/module/
  • 重命名
[whybigdata@node01 module]# mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha sqoop-1.4.6-hdp-2.0.4

修改配置文件

Sqoop的配置文件与大多数大数据框架类似,在Sqoop安装目录下的 conf 目录中。

重命名配置文件

[whybigdata@node01 conf]# mv sqoop-env-template.sh sqoop-env.sh

2) 修改配置文件

[whybigdata@node01 conf]# vim sqoop-env.sh

export HADOOP_COMMON_HOME=/opt/module/hadoop-2.7.2
export HADOOP_MAPRED_HOME=/opt/module/hadoop-2.7.2
export HIVE_HOME=/opt/module/hive-2.1.0
export ZOOKEEPER_HOME=/opt/module/zookeeper-3.5.7
export ZOOCFGDIR=/opt/module/zookeeper-3.5.7
export HBASE_HOME=/opt/module/hbase-1.1.5

拷贝JDBC驱动

拷贝jdbc驱动到sqoop的lib目录下,如:

[whybigdata@node01]# cp mysql-connector-java-5.1.27-bin.jar /opt/module/sqoop-1.4.6-hdp-2.0.4/lib/

验证Sqoop

我们可以通过某一个command来验证sqoop配置是否正确:

[whybigdata@node01]#  bin/sqoop help

出现一些Warning警告(警告信息已省略),并伴随着帮助命令的输出:

Available commands:
codegen      Generate code to interact with database records
create-hive-table   Import a table definition into Hive
eval        Evaluate a SQL statement and display the results
export       Export an HDFS directory to a database table
help        List available commands
import       Import a table from a database to HDFS
import-all-tables   Import tables from a database to HDFS
import-mainframe  Import datasets from a mainframe server to HDFS
job        Work with saved jobs
list-databases    List available databases on a server
list-tables      List available tables in a database
merge       Merge results of incremental imports
metastore      Run a standalone Sqoop metastore
version      Display version information

测试Sqoop是否能够成功连接数据库

[whybigdata@node01]#  bin/sqoop list-databases --connect jdbc:mysql://node01:3306/ --username root --password 123456

出现如下输出:Sqoop安装成功

information_schema
metastore
mysql
oozie
performance_schema

全文结束!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/670439.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

redis高可用集群搭建

redis高可用集群搭建 redis的安装配置允许远程访问重启服务检查服务是否启动架构图开始搭建集群安装ruby创建集群高可用测试redis集群的扩展将7号机添加为新的master节点添加从节点删掉一个slave节点删除master节点 redis的安装 sudo apt-get install redis-server配置允许远程…

引进吸收再消化,可借鉴的产业超车模式探索

近期,C919大型客机顺利开启商业首航,这也标志着坐国产大飞机出行的时代来了!C919是我国首次按照国际适航标准自行研制、具有自主知识产权的喷气式干线客机,它的商用飞行也象征着我国对波音、空中客车等大型客机企业垄断地位的一次…

【unity每日一记】unity中常见的特性大全

👨‍💻个人主页:元宇宙-秩沅 👨‍💻 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由 秩沅 原创 👨‍💻 收录于专栏:uni…

【每日一题】LCP 41. 黑白翻转棋

【每日一题】LCP 41. 黑白翻转棋 LCP 41. 黑白翻转棋题目描述解题思路 LCP 41. 黑白翻转棋 题目描述 在 n*m 大小的棋盘中,有黑白两种棋子,黑棋记作字母 “X”, 白棋记作字母 “O”,空余位置记作 “.”。当落下的棋子与其他相同颜色的棋子在…

JMeter根据负载量计算并发用户数实例

目录 前言: 业务需求 分析需求 测试模型构建 & 用例设计 一、场景构建:登录业务操作流程、考勤打卡操作流程; 二、场景用例设计 三、测试脚本用例设计: 模型构建 登录打卡-操作流程: 场景设计 常用测试场景的类型:…

nx安装llvmlite与numba

文参考 Python安装llvmlite、numba报错解决方案_ClearLon的博客-CSDN博客 llvmlite与numba你可以理解为用于数据处理的加速包 我的python版本为3.6.9,llvmlite版本为0.32.1,numba版本为0.49.1 目录 1 安装 llvmlite 2 安装numba 1 安装 llvmlite…

软件测试技能,JMeter压力测试教程,登录参数化CSV 数据文件设置(五)

目录 前言 一、场景案例 二、登录接口 三、测试数据准备 四、CSV数据文件设置 五、查看结果 前言 我们在压测登录接口的时候,如果只用一个账号去设置并发压测,这样的结果很显然是不合理的,一个用户并发无法模拟真实的情况 如果要压测…

Python的特点和优势

Python的优特点 简单易学: Python语言相对于其他编程语言来说,属于比较容易学习的一门编程语言,它注重的是如何解决问题而不是编程语言的语法和结构。正是因为Python语言简单易学,所以,已经有越来越多的初学者选择Pyth…

你可以不用RxJava,但必须得领悟它的思想!

作者:cofbro 前言 Rx 是一种响应式编程的思想,如今有很多语言都支持这种思想:RxJava,RxJs,RxSwift...。它是基于特殊的观察者模式来实现的,能够轻松的实现异步事件响应流,避免回调地狱的产生。…

Avalon总线协议

Avalon总线主要用于片内处理器与外设,常用于高速数据传输流、读写寄存器和存储器、控制片外器等。 Avalon 总共有七种接口: Avalon Clock Interface, Avalon时钟接口 -- 驱动或接收时钟信号的接口Avalon Reset Interface, Avalon复位接口 -- 驱动或接收…

想要好用的ai绘画工具推荐?分享怎么文字生图片在线

小张: 嘿,小明,你有没有听说过在线将文字转换成图片的工具?我最近在寻找一种方法,可以将我的文字描述转化为视觉图像。 小明: 嗯,听起来很有趣!你是指通过某种技术把文字转换成图片,然后展示出…

亚马逊加购对卖家有什么作用?

对亚马逊卖家来说,亚马逊的加购功能也具有一些重要的作用: 1、增加销售机会:当买家将卖家的商品添加到购物车中时,这表示他们对该商品有兴趣,并考虑购买。这为卖家提供了一个机会,因为购物车中的商品更有可…

【For¥】产品落地到$进账重要流程中你需要知道的东西

文章目录 产品思维空、雨、伞-决策思维5W1H-重点思维矩阵分析法费米推理 工具 开发解决方案(实现)调优(性能)安全 营销运营常见运营岗位分类运营必备能力 销售策略手段方式话术 来源 产品 思维 空、雨、伞-决策思维 产品经理作…

使用yolov5训练自己的数据集并测试效果

1.源码下载链接 1.yolov5原模型以及权重文件 链接:https://pan.baidu.com/s/1XlvHIxlzJEqp2wlRx5Fb1w 提取码:xtkj 2.训练自己数据集的完整代码 链接:https://pan.baidu.com/s/1xdnah8ZLoT7E1YDm-RiGzQ 提取码:9261 2.训练…

CASAIM签约AMOOL TRADING COMPANY LTD,正式进军中东市场

随着3D打印、三维数字化及全自动化智能检测技术的不断进步和应用领域的扩大,全球市场在高速增长。CASAIM作为国内领先的3D打印、三维数字化及全自动化智能检测技术研发及制造商,一直致力于为全球智能制造企业提供高精度、高效率的智能制造及检测解决方案…

【深度学习】segment-anything使用过程

文章目录 官网Checkpoints安装快速体验导出onnxWeb应用jupyter 脚本运行SAM的脚本automatic_mask_generator_example 官网 https://github.com/facebookresearch/segment-anything Checkpoints 三种模型: parser.add_argument( “–model-type”, typestr, requi…

前端JavaScript中的动态事件添加

💂 个人网站:【海拥】【游戏大全】【神级源码资源网】🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 目录 前言事件的基本概念动态…

使用AI聊天模型写作和编码心得

原文合集地址如下,有需要的朋友可以关注 本文地址 合集地址 给大家推荐一个国内暂时免费使用AI聊天模型的网站: ChatAnywhere 有需要的朋友可以点击试用一下。 写文档 要点 详细描述要干的事情 说清楚你的需求,例如: 可…

vue3的代码片段如何设置

vscode -文件-用户代码片段 {"vue3 template": {"prefix": "vue3","body": ["<template>"," <div>","$1"," </div>","</template>\n","<s…

家政服务小程序开发

随着人们生活水平的提高和生活节奏的加快&#xff0c;越来越多的家庭需要家政服务来解决家庭问题。为了更好地满足用户需求&#xff0c;家政行业开始发展家政小程序。下面我们来介绍一下家政小程序的主要功能。 1. 家政下单 家政小程序的主要功能之一是家政下单。用户可以在小…