大数据组件Sqoop-安装与验证

news2024/11/13 15:24:08

🥇🥇【大数据学习记录篇】-持续更新中~🥇🥇


个人主页:beixi@
本文章收录于专栏(点击传送):【大数据学习】

💓💓持续更新中,感谢各位前辈朋友们支持学习~

文章目录

    • 1.Sqoop组件介绍
    • 2.环境介绍
    • 3.搭建步骤

1.Sqoop组件介绍

Sqoop是一个用于在Apache Hadoop和关系型数据库(如MySQL、Oracle等)之间进行数据传输的工具。它提供了简单易用的命令行界面,可以将结构化数据从关系型数据库导入到Hadoop中的分布式文件系统(如HDFS),或者将数据从Hadoop导出到关系型数据库。

Sqoop由以下组件构成:

  • Sqoop核心组件(Core):Sqoop核心组件包括连接管理器(Connection Manager)、作业调度(Job Scheduling)、任务划分(Task Partitioning)和执行引擎(Execution Engine)等。它们一起协调Sqoop的数据传输过程。

  • 连接管理器(Connection Manager):连接管理器负责与关系型数据库建立连接,并管理数据库连接信息。Sqoop支持多种关系型数据库,每种数据库都有对应的连接管理器。

  • 作业调度(Job Scheduling):作业调度模块负责管理和调度Sqoop的数据传输作业。它可以按照预定的时间表执行作业,也可以手动触发作业的执行。

  • 任务划分(Task Partitioning):任务划分模块将数据导入或导出过程划分为多个任务,并将这些任务分配给可用的计算资源执行。任务划分考虑了数据的并行性和负载均衡性,以提高数据传输的效率。

  • 执行引擎(Execution Engine):执行引擎是Sqoop的核心组件之一,它负责实际执行数据传输作业。Sqoop支持多种执行引擎,包括MapReduce、YARN和Spark等。根据Hadoop集群的配置和需求,可以选择合适的执行引擎。

  • 导入器(Importer)和导出器(Exporter):导入器和导出器是Sqoop的两个关键模块。导入器用于将关系型数据库中的数据导入到Hadoop中,导出器用于将Hadoop中的数据导出到关系型数据库。

  • 元数据存储(Metastore):元数据存储用于存储Sqoop的元数据信息,如连接信息、作业信息、导入导出的数据信息等。Sqoop支持多种元数据存储方式,包括关系型数据库(如MySQL、PostgreSQL)和Hadoop的分布式文件系统(如HDFS)。
    在这里插入图片描述

2.环境介绍

本次实验使用到的环境有:
(1)Oracle Linux 7.4
(2)Hadoop 2.7.4
(3)Sqoop1.4.6

3.搭建步骤

1.软件Sqoop1.4.6版本下载链接:

http://archive.apache.org/dist/sqoop/1.4.6

在这里插入图片描述

2.解压文件到/opt目录下。

tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt/sqoop

在这里插入图片描述

3.修改系统环境变量配置文件。

vi .bashrc 

在这里插入图片描述
在这里插入图片描述

4.配置系统环境变量(按 i 进入编辑模式),保存文件。

#Sqoop
export SQOOP_HOME=/opt/sqoop
export PATH=$PATH:$SQOOP_HOME/bin

在这里插入图片描述

5.刷新文件使其立即生效。

source .bashrc

在这里插入图片描述

6.验证安装是否成功。

sqoop version

在这里插入图片描述
至此Sqoop的安装与验证就结束了,如果本篇文章对你有帮助记得点赞收藏+关注~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/959703.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

NowCoder刷题 Python篇

NowCoder刷题 Python篇 Python入门 01 输入输出输入输出NP1 Hello World!NP2 多行输出NP3 读入字符串 01 输入输出 输入输出 NP1 Hello World! 参考代码: str Hello World! print(str)结果: NP2 多行输出 参考代码: str1 Hello World!…

上层应用开发与底层开发前途相比

底层开发和应用层开发都有自己的前途和发展方向,没有绝对的优劣之分。以下是对底层开发和应用层开发的一些观点:底层开发:优势:对计算机系统底层原理和技术有深入了解,能够进行系统级编程和优化,掌握底层技…

python爬虫—requests

一、安装 pip install requests 二、基本使用 1、基本使用 类型 : models.Response r.text : 获取网站源码 r.encoding :访问或定制编码方式 r.url :获取请求的 url r.content :响应的字节类型 r.status_code :响应…

在Mac终端使用unrar和rar 解压和压缩软件

1、首先从rarlab 网站下载 rar / unrar 工具 rarlab网站: https://www.rarlab.com/download.htm 2、解压缩下载的 tar.gz 压缩包(rarmacos-x64-623.tar.gz),在下载目录downloads下自动创建一个rar的目录,其…

应用案例 | 基于三维机器视觉的机器人麻袋拆垛应用解决方案

​Part.1 项目背景 在现代物流和制造行业中,麻袋的拆垛操作是一个重要且频繁的任务。传统的麻袋拆垛工作通常由人工完成,分拣效率较低,人力成本较高,现场麻袋堆叠、变形严重,垛型不规则、不固定,严重影响分…

利用随机数生成猜数字游戏【C语言】

猜数字游戏实现 游戏要求生成随机数rand 函数srand 函数time 函数 确定生成随机数的范围猜数字游戏实现 游戏要求 自动生成随机数的范围:0-99玩家猜数字,猜数字的过程中,根据猜测数据的大小给出大了或小了的反馈,直到猜对&#x…

JavaScript Web APIs - 05 Window对象 、本地存储

Web APIs - 05 文章目录 Web APIs - 05js组成window对象定时器-延迟函数location对象navigator对象histroy对象本地存储(今日重点)localStorage(重点)sessionStorage(了解)localStorage 存储复杂数据类型 综…

unity面试题(基础篇)

事件函数的执行顺序 事件函数的执行顺序 - Unity 手册运行 Unity 脚本会按预定顺序执行大量事件函数。本页面将介绍这些事件函数,并说明它们的执行顺序。https://docs.unity.cn/cn/2019.4/Manual/ExecutionOrder.html 加载第一个场景 Awake:始终在任何 Start 函数之前并在实…

Linux(CentOS7)下如何配置多个Tomcat容器?

一、在 liunx 系统安装 jdk 1、安装jdk(yum install 安装) 查看是否系统是否自带jdk并卸载 rpm -qa |grep java rpm -qa |grep jdk rpm -qa |grep gcj 其中,GCJ是GNU的Java编译器,可以把java程序编译成本地代码,编译成功后的可…

Linux中安装MySQL5.7.42

1. 首先,下载mysql5.7.42的安装包(下方是下载地址),选择红色框框的下载(注意的是,这个链接只提供5.7的版本下载,可能还会更新,不一定打开就是5.7.42的版本,后续可能会有4…

坦克400 Hi4-T预售价28.5万元起,越野新能源好理解

8月25日,在以“智享蓉城,驭见未来”为主题的成都国际车展上,坦克品牌越野新能源再启新程,首次以全Hi4-T新能源阵容亮相展台,释放坦克品牌加速布局越野新能源的强烈信号。 Hi4-T架构首款落地车型坦克500 Hi4-T上市至今斩…

【C++入门】string类常用方法(万字详解)

目录 1.STL简介1.1什么是STL1.2STL的版本1.3STL的六大组件1.4STL的缺陷 2.string类的使用2.1C语言中的字符串2.2标准库中的string类2.3string类的常用接口说明 (只讲解最常用的接口)2.3.1string类对象的常见构造2.3.2 string类对象的容量操作2.3.3string…

stable diffusion实践操作-大模型介绍

本文专门开一节写大模型相关的内容,在看之前,可以同步关注: stable diffusion实践操作 常用到的基础模型和插件(持续更新中) 链接:https://pan.baidu.com/s/1c9utQmWlGcRqLTr_kftTyA?pwd1111 提取码&…

go语言配置

1、Go语言的环境变量 与Java等编程语言一样,安装Go语言开发环境需要设置全局的操作系统环境变量(除非是用包管理工具直接安装) 主要的系统级别的环境变量有两个: (1)GOROOT:表示Go语言环境在计算机上的安…

学习网络编程No.5【TCP套接字通信】

引言: 北京时间:2023/8/25/15:52,昨天刚把耗时3天左右的文章更新,充分说明我们这几天并不是在摆烂中度过,而是在为了更文不懈奋斗,历时这么多天主要是因为该部分知识比较陌生,所以需要我们花费…

行业追踪,2023-09-01

自动复盘 2023-09-01 凡所有相,皆是虚妄。若见诸相非相,即见如来。 k 线图是最好的老师,每天持续发布板块的rps排名,追踪板块,板块来开仓,板块去清仓,丢弃自以为是的想法,板块去留让…

云原生架构:在云环境中构建弹性应用

随着云计算技术的快速发展,云原生架构已经成为现代软件开发的热门话题。作为一种在云环境中构建和运行应用程序的方法论,云原生架构强调弹性、可扩展性和灵活性,使开发者能够更好地应对复杂的业务需求。本文将深入探讨云原生架构的核心概念、…

Screaming Frog SEO Spider,为您的网站提供全方位的优化解决方案

Screaming Frog SEO Spider是一款适用于Mac的软件,它可以帮助用户分析网站的优化信息。该软件可以模拟蜘蛛爬行的方式,抓取网站的各种信息,并将这些信息整理成易于理解的报告。这些报告可以帮助用户评估网站的优化情况,发现链接的…

【Kali Linux】高级渗透测试实战篇

这里写目录标题 前言内容简介读者对象随书资源目录 前言 对于企业网络安全建设工作的质量保障,业界普遍遵循PDCA(计划(Plan)、实施(Do)、检查(Check)、处理(Act&#xff…

排序算法的稳定性

稳定性:对于一个数,经过多次排序,保留一个数之间的相对次序 在基础类型数据上,稳定性用处不大 在非基础类型上,可以做到对于相同元素来说,排完序相同元素之间的相对次序不变 归并排序在merge的过程中先拷贝…