Centos 安装Datax及Datax-web

news2024/11/26 22:50:26

异构数据的采集,方案还是比较多样,除了基于大数据平台的一些集成;简单的数据源,可以直接使用阿里开源的datax来实现;datax-web则是datax界面化操作的开源框架,集成了datax异构数据采集和任务调度的功能。关于datax的一些详细介绍大家可以上官方git上看看,这里主要介绍Datax的安装以及datax-web的安装及使用。

基础软件环境:

1、JDK1.8

2、Mysql5.5+

3、Datax

4、Python(本文使用默认2.x)

5、Maven(datax-web如果直接使用git上面下的源码需要编译,本文使用官方提供免编译版tar包,可以不需要maven)

一、datax安装

1、下载datax

# wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz

2、直接解压安装到指定目录

# tar -zxvfdatax.tar.gz -C /opt/

3、调试验证

进入相应目录

# cd /opt/datax/bin

# python datax.py../job/job.json

# 这里有reader和writer会显示报错,需要执行删除相应的文件即可(文件没看见,但还是执行一下

# rm -rf/opt/datax/plugin/reader/._*

接着执行:

# python datax.py../job/job.json

报错后再删除writer的相应目录

# rm -rf/opt/datax/plugin/writer/._*

最后再执行datax验证任务就能成功

# python datax.py../job/job.json

出现以下信息说明datax安装成功

二、datax-web安装配置

1、下载免编译包(在git地址上)

#https://github.com/WeiYe-Jing/datax-web/blob/master/doc/datax-web/datax-web-deploy.md

2、解压到指定目录

# tar -zxfdatax-web-2.1.2.tar.gz -C /opt/

3、进入目录执行安装

# cd /opt/datax-web-2.1.2/bin

# sh install.sh

(一直Y确认,出现以下信息,安装完成)

4、初始化数据库并且配置数据库信息

在客户端或者数据库命令行执行以下相应脚本(可以通过source导入)

# /opt/datax-web-2.1.2/bin/db/datax_web.sql

修改数据库配置文件(与上面执行初始化脚本一致)

# vim /opt/datax-web-2.1.2/modules/datax-admin/conf/bootstrap.properties

5、其他配置

邮件服务配置:

# /opt/datax-web-2.1.2/modules/datax-admin/bin/env.properties

Python执行脚本配置:

# /opt/datax-web-2.1.2/modules/datax-executor/bin/env.properties

配置datax.py运行脚本;

或者修改配置改成绝对路径:

#/opt/datax-web-2.1.2/modules/datax-executor/bin/datax-executor.sh

否则运行脚本的时候会报错

# 运行报错“/usr/bin/python: can't find'__main__' module in ''” _

6、启动 (出现一下两个进程则启动成功)

# cd /opt/datax-web-2.1.2/bin

# sh start-all.sh

7、登录(admin/123456)

# http://host:9527/index.html

至此,datax及datax-web安装配置完成。这是在同一台机器上的安装,如果任务比较多,则datax需要集群化部署。

===================== datax集群化部署==============================

三、datax集群部署(添加datax-executor节点)

新添加的executor节点,需要安装datax,datax-web(只启动datax-executor即可)

1、解压安装到指定目录

2、bin同级创建modules目录(没有的话创建)

解压datax-executor到modules下

# tar -zxfdatax-executor_2.1.2_1.tar.gz -C ../modules/

3、修改$datax-executor/bin/env.properties执行脚本路径

# vim /opt/datax-web-2.1.2/modules/datax-executor/bin/env.properties

4、修改$datax-executor/conf/ application.yml 指定web地址(这里address指定之前的web地址即可)

# vim /opt/datax-web-2.1.2/modules/datax-executor/conf/ application.yml

5、启动executor

如果没有自动注册,需要手工添加执行器即可(一般没有出错的化都能自动注册上)

到这里,datax完成集群部署,在使用集群executor的时候会根据配置的策略进行多节点运作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/143361.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Kubernetes | Pod 系列】 Pod 的生命周期 Ⅱ —— 容器重启策略

目录题5.4 容器重启策略示例(1)Always 策略(2)OnFailure 策略(3)Never 策略5.4 容器重启策略 在 Pod 的 YAML 清单的 spec 中包含一个 restartPolicy 字段,其可能取值包括 Always(…

Jdbc配置文件连接mysql8.0——批量增删改查操作

目录 一、批量插入数据 (一)在DogDao中新增一个功能saveDogList (二)DogDaoImpl实现类中定义字符串拼接实现功能saveDogList (三)DogTest测试 (四)批量插入运行结果 (五)优化后的批量插入 1.DogDao接口中还是使用原来的新增功能saveDog 2. DogDaoImpl实现类中实现saveD…

DOS、DDos攻击详解

目录 一、DDOS 是什么? 二、DDoS的危害 三、常见的DOS攻击 四.DDoS的防范 一、DDOS 是什么? DoS为Denial of Service的简称,意思是拒绝服务。DoS攻击是一种使被攻击者无法正常提供服务的攻击 来解释一下,DDOS 是什么。 举例…

esxi6.0安装

一、安装exsi需要注意的事项: 1.进入BIOS做raid 不同硬件厂商进入bios的方式各不相同,请自行查阅相关资料 RAID 0的特点: 最少需要两块磁盘 数据条带式分布 没有冗余,性能最佳(不存储镜像、校验信息) 不能应用于对数据安全性要求…

代码随想录回溯总结

文章目录0、 前言1、回溯的定义2、回溯解决那些问题3、回溯模板4、问题详解4、1组合问题:[4.1.1 组合](https://leetcode.cn/problems/combinations/)[4.1.2 组合总和 II](https://leetcode.cn/problems/combination-sum-ii/)4.1.3 组合的其他问题4.2排列问题4.2.1[…

3.Isaac入门

Isaac入门 本节提供有关如何开始开发和运行 Isaac 应用程序的指南。 文章目录Isaac入门教程和示例应用程序运行应用程序应用程序控制台选项在 Jetson 上部署和运行Python 应用程序支持使用分布式工作区使用 Docker安装依赖创建 Isaac SDK 开发镜像教程和示例应用程序 有一个可…

【运维有小邓】实时告警通知

当网络上发生特定事件时,EventLog Analyzer可以通过多种方式进行响应。EventLog Analyzer可以实时生成告警 - 发送电子邮件或短信通知给指定的接收者 - 或运行由管理员提供的自定义脚本。通过所提供的多个选项,用户可以确保不会错过任何安全事件。EventL…

Python解题 - CSDN周赛第21期 - 接雨水

本期比赛都是比较基础的排序、查找,没有多少难度。不过有很多人反映第二题测试数据有问题,基本所有选手在本题上都没得分。最近官方每期比赛都会有类似的数据问题,虽然参赛者对数据有疑问,但从未得到解答,官方也未曾公…

十年云深时:天翼云的成长密钥

工业时代,我们通常以“用电量”作为指标,来衡量一个地方的经济发展水平。数字经济时代,“用云量”则与数字经济规模呈正相关。因此,中国数字化浪潮的持续推进,也让云计算行业的重要性与市场竞争性不断提升,…

【C语言】交换奇偶位和 offsetof 宏的实现

​🌠 作者:阿亮joy. 🎆专栏:《阿亮爱刷题》 🎇 座右铭:每个优秀的人都有一段沉默的时光,那段时光是付出了很多努力却得不到结果的日子,我们把它叫做扎根 目录👉交换奇偶…

2021年 APP个人信息使用态势分析报告

声明 本文是学习2021年APP个人信息使用态势分析报告. 下载地址 http://github5.com/view/55008而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 App违规行为处罚案例 某赚钱类App未明示信息收集规则被罚 经查公安机关调查,某网络科技公司开…

2023 CPA 会计-存货【刷题】

1. 存货的确认和初始计量 大元公司为增值税一般纳税人,增值税税率为13%。 这句话好像没有用 2019年购入材料300公斤,收到增值税发票注明价款1800万元,增值税税额是234万元。 增值税是在价款的基础上收取的,所以这批材料的价值就是…

【收集】缩写合集

AABB 全称:Axis Aligned Bounding Box参考 https://blog.csdn.net/qq_22822335/article/details/50930437AABB包围盒在游戏中,为了简化物体之间的碰撞检测运算,通常会对物体创建一个规则的几何外形将其包围。其中,AABB&#xff08…

【链表】关于链表,你该了解这些!

【链表】理论基础1 链表是什么1.1 单链表1.2 双链表1.3 循环链表2 链表的存储方式3 链表的定义3.1 C/C方式3.2 Java方式3.3 JavaScript方式4 链表的操作4.1 删除结点4.2 添加结点1 链表是什么 1.1 单链表 单链表是一种通过指针串联在一起的线性结构,每一个节点由两…

谷粒学苑项目-第一章数据库设计与项目结构

一、数据库设计 1、数据库 guli2、数据表 CREATE TABLE edu_teacher (id char(19) NOT NULL COMMENT 讲师ID,name varchar(20) NOT NULL COMMENT 讲师姓名,intro varchar(500) NOT NULL DEFAULT COMMENT 讲师简介,career varchar(500) DEFAULT NULL COMMENT 讲师资历,一句话说…

6个实用的红米手机技巧

❤️作者主页:IT技术分享社区 ❤️作者简介:大家好,我是IT技术分享社区的博主,从事C#、Java开发九年,对数据库、C#、Java、前端、运维、电脑技巧等经验丰富。 ❤️个人荣誉: 数据库领域优质创作者🏆&#x…

盐湖提锂纳滤膜后钙镁离子深度处理技术

盐湖提锂:大规模、低成本,全球锂资源供应主体的理想来源锂作为自然界中轻、标准电极电势低、电化学当量大的金属元素,是天生理想的“电池金属”,因此在要求高比能的动力和储能应用场景中将具备长期的需求刚性,被誉为“…

Skywalking简单入门使用

🏆今日学习目标: 🍀Skywalking简单入门使用 ✅创作者:林在闪闪发光 ⏰预计时间:50分钟 🎉个人主页:林在闪闪发光的个人主页 🍁林在闪闪发光的个人社区,欢迎你的加入: 林…

软件测试/测试开发丨 | 想做App测试就一定要了解的App结构

性能测试 所谓的性能测试要在功能测试之后。 功能测试:关注能不能用 性能测试:关注好不好用 常见的性能关注点有: 接口响应时间:50毫秒 ~ 1000毫秒 吞吐量:1000万每天,2000万每天 ......10亿每天 TPS&a…

java面试题基本部分

一、Java 基础 1.Java常见基本类型如下 整数类(byte、short、int、long) 浮点类(float、double) 字符类(char) 布尔型(boolean)大小: boolean(8位 1字节) byte(8位 1字…