大数据之数据采集项目延伸——sqoop

news2024/11/24 16:11:00

承接上篇文章
大数据之数据采集项目总结——hadoop,hive,openresty,frcp,nginx,flume
https://blog.csdn.net/qq_43759478/article/details/131520375?spm=1001.2014.3001.5501
在上个阶段:完成了数据收集,使用flume把日志文件上传到hdfs,并且使用hive创建了分区表

现在补充:使用sqoop把hdfs/hive中的数据导出到MySQL中。
总览:
在这里插入图片描述

show databases;
use ods_news;
show tables;
select * from news_parquet;
-- 筛选出来40条数据,把这个数据存入一个新表,使用sqoop把它导入到MySQL中
select distinct_id,model,network_type,carrier
from news_parquet 
where model is not null and model !="" and network_type !="" and carrier <>"";
-- 创建表
create table useful_info 
row format delimited 
fields terminated by ","
as
(
select distinct_id,model,network_type,carrier
from news_parquet 
where model is not null and model !="" and network_type !="" and carrier <>""
);

-- 查询一下表数据,存在
select * from useful_info;

数据展示:
在这里插入图片描述
在hdfs上:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

编写sqoop,把数据导出到MySQL

把useful_info中的数据导出到datacollection上的MySQL数据库中。
查看datacollection中MySQL的数据库和表

show databases;

在这里插入图片描述

use test1;
show tables;

在这里插入图片描述

1、在MySQL创建表

注意:导出并不会自动创建对应的表,需要提前自己创建
在test1 数据库中新建一个表 from_sqoop_hdfs

CREATE TABLE from_sqoop_hdfs(
  distinct_id VARCHAR(20),
  model VARCHAR(50),
  network_type VARCHAR(50),
  carrier VARCHAR(50)
) CHARACTER SET utf8;

2、将hive上的数据导入mysql表中

在Linux命令行直接输入下面的语句:

sqoop export \
--connect jdbc:mysql://datacollection:3306/test1 \
--username root \
--password 123456 \
--table from_sqoop_hdfs \
--export-dir hdfs://datacollection:8020/user/hive/warehouse/ods_news.db/useful_info/000000_0 \
--input-fields-terminated-by ',' \
--input-lines-terminated-by '\n'

成功啦!必须截个图纪念一下!!

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/725248.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

查找满足条件的文件

linux 系统下查询当前多个子目录下满足条件的文件 find ./ -mindepth 2 -name *.png

attention中为啥multi-head输出结果进行concat,得到x,x还要乘上一个WO矩阵?

刚刚在敲vit模型代码&#xff0c;突然一个疑问&#xff0c;就是multi-head输出结果进行concat&#xff0c;得到x&#xff0c;x的维度是预期维度&#xff0c;然后再乘以一个WO矩阵&#xff0c;为啥要乘上一个WO矩阵&#xff0c;x的维度已经是预期的了&#xff1f;&#xff1f;&a…

C#基础学习_类的方法

C#基础学习_类的方法 概念:描述对象的动态特征 类型:实例方法、静态方法等 方法的定义: 访问修饰符(默认为private) 返回值类型 方法名(类型 参数1,类型 参数2,...) {//这里编写方法的主体(功能实现的具体过程)return 返回值; //若没有返回值,则不需要写该语句 }

2023年第四届“华数杯”全国大学生数学建模竞赛(附历年赛题和论文)

目录 华数杯简介大赛资料获取方式 华数杯简介 国赛前的预热”华数杯“第四届正在报名中&#xff0c;看到咨询我们的同学不少&#xff0c;挺多同学都非常感兴趣&#xff0c;但是又不清楚比赛的相关情况&#xff0c;这里将会给同学们一一答疑。 比赛难度&#xff1a;难度适中&am…

【面试常见】JS继承与原型、原型链

前后端面试题库 &#xff08;面试必备&#xff09; 推荐&#xff1a;★★★★★ 地址&#xff1a;前端面试题库 web前端面试题库 VS java后端面试题库大全 在 JavaScript 中&#xff0c;继承是实现代码复用和构建对象关系的重要概念。本文将讨论原型链继承、构造函数继承以及…

QML Canvas 制作动画

作者: 一去、二三里 个人微信号: iwaleon 微信公众号: 高效程序员 终于要介绍动画了,这意味着我们快要把 Canvas 学完了,所以是时候庆祝一下了… 要在 Canvas 上实现动画,需要间隔一定的时间重绘动画的下一帧,而且频率要足够快,这样才能在图像切换时看起来像动画一样。…

一篇文章让你搞懂字符指针,数组指针,指针数组,数组传参和指针传参,函数指针

回顾 首先我们来大概回顾一下指针初阶的知识 内存会划分为一个个的内存单元&#xff0c;每个内存单元都有一个独立的编号—编号也被称为地址&#xff0c;地址在C语言中也被称为指针&#xff0c;指针&#xff08;地址&#xff09;需要存储起来—存储到变量中&#xff0c;这个变…

【Redis】缓存穿透、缓存击穿、缓存雪崩的原因及解决方案

文章目录 一、缓存穿透1.1 产生原因1.2 解决方法接口校验对空值进行缓存使用布隆过滤器实时监控 二、缓存雪崩2.2 解决方法将失效时间分散开给业务添加多级缓存构建缓存高可用集群使用锁或者队列的方式设置缓存标记 三、缓存击穿3.2 解决方法使用互斥锁”提前“使用互斥锁 / 逻…

QT开发技巧之QTableWidget设置表头颜色字体

1.默认的表头和内容背景字体一样不好区别&#xff0c;可以通过qss设置修改表头样式 2.修改后效果如下 qss代码&#xff1a; /*表格头背景色*/ QHeaderView::section { background: rgb(128, 255, 255); font-family: "宋体"; font-weight:bold; font-size:16px; }

网站弱口令爆破小脚本

介绍 weakpass_exploit&#xff0c;网站弱口令爆破小脚本 优点&#xff1a; 绕过图形验证码 绕过前端数据加密 不足&#xff1a; ddddocr识别不够精确 单线程 注: 本项目所有文件仅供学习和研究使用,请勿使用项目中的技术源码用于非法用途,任何人造成的任何负面影响,与…

什么是linux内存节点?为什么要有内存节点?

什么是内存节点 在Linux中&#xff0c;内存节点指的是NUMA&#xff08;Non-Uniform Memory Access&#xff09;架构中的逻辑内存节点&#xff0c;也被称为内存域&#xff08;Memory Domain&#xff09;。NUMA是一种多处理器体系结构&#xff0c;其中每个处理器都有自己的本地内…

FP32、FP16 和 INT8

文章目录 FP32、FP16 和 INT81. FP322. FP163. INT8 FP32、FP16 和 INT8 当涉及到深度学习和计算任务时&#xff0c;FP32、FP16、INT8 和 INT4 是常用的数据类型&#xff0c;用于表示不同的数值精度和存储需求。 1. FP32 单精度浮点数&#xff1a;提供了较高的精度和动态范围…

彻底解决IJ IDEA 代码运行时中文乱码 | 完美解决方案

前言&#xff1a; 在我们刚接触到IDEA时&#xff0c;想美滋滋的敲一个“hello world”来问候这个世界&#xff0c;但难免会遇到这种问题 乱码&#xff01;乱码&#xff01;乱码&#xff01; 内心的崩溃就在一瞬间&#xff0c;下面我就来分享几个实用的解决方法 1.调整系统语…

Plant Physiology:DAP-seq技术在毛白杨PtoWRKY68等位基因变异调控干旱胁迫响应机制研究中的应用

干旱胁迫限制了树木的生长&#xff0c;并影响其地域性分布。为了应对干旱胁迫&#xff0c;植物进化出了一系列的生理生化反应机制&#xff0c;以保护植物细胞免受损害。因此&#xff0c;研究干旱胁迫下树木生理和光合作用变化的分子机制&#xff0c;将有助于培育耐旱性树木新品…

excel 表格多行自动合并

在现实生活中常常遇到这样的一些需求 使用的是三方的插件来实现的 参考&#xff1a; 慧办公-官网 (hbg666.com) (支持 Office 及 WPS)下载地址&#xff1a; https://www.hbg666.com/ 使用方法系统都有教导

单片机第一季:零基础4——数码管

1,第七章&#xff1a;静态数码管和动态数码管 工作原理&#xff1a; (1)亮灭原理&#xff08;其实就是内部的照明LED&#xff09;&#xff1b; (2)显示数字&#xff08;甚至文字&#xff09;原理&#xff1a;利用内部的LED的亮和灭让外部的组成数字的笔画显示或者不显示&#…

IDEA 错误:找不到或无法加载主类Main 完美解决方法

今天在运行项目的时候 Rebuild Prodject 后突然出了这样一个错误&#xff1a;IDEA 错误 找不到或无法加载主类,相信只要是用过IDEA的朋友都遇到过它吧&#xff0c;把我自己搞的焦头烂额&#xff01;&#xff01;csdn翻遍了没解决 1&#xff0c;未能成功编译&#xff1b; 尝试&a…

pycharm的一些常用设置

pycharm的一些常用设置 1、最新安装pycharm ,怎么设置解释器如图&#xff1a; 2、可通过鼠标放大缩小配置&#xff1a; 进入setting>Editor>File and Code Templates&#xff0c;点击python script&#xff0c;进行设置&#xff1a; """Author : A Tim…

【C语言初阶】带你轻松掌握指针基础知识完结篇——野指针,指针运算,指针和数组,二级指针

君兮_的个人主页 勤时当勉励 岁月不待人 C/C 游戏开发 Hello&#xff0c;这里是君兮_&#xff0c;今天继续给大家更新0基础入门C语言的内容&#xff0c;我们这次主要更新的依然是初阶指针的基础知识 废话不多说咱们直接开始吧&#xff01;&#xff01; 指针基础 一. 野指针1.…

运输层:TCP报文段的首部格式

1.运输层&#xff1a;TCP报文段的首部格式 笔记来源&#xff1a; 湖科大教书匠&#xff1a;TCP报文段的首部格式 声明&#xff1a;该学习笔记来自湖科大教书匠&#xff0c;笔记仅做学习参考 为了实现可靠传输&#xff0c;TCP采用了面向字节流的方式。 但TCP在发送数据时&#…