DataX 及 DataX-Web 安装使用详解

news2024/9/22 11:41:58

文章目录

      • 一、DataX安装
        • 1、解压datax.tar.gz
        • 2、运行自检脚本
      • 二、Datax-Web安装
        • 1、解压DataXWeb安装包
        • 2、执行一键安装脚本
        • 3、启动服务

前段时间在项目上使用了阿里的离线数据同步工具datax,在大批量的表同步过程中踩了一些坑,所以详细介绍一下,希望对大家有所帮助。

本文将先介绍dataxhe datax-web的安装及使用,比较简单,但是实际使用过程中还有许多需要改进的地方,后面文章将接着介绍datax及datax-web源码打包、二次开发支持Oracle更新数据等,敬请期待。


datax介绍:https://github.com/alibaba/DataX/blob/master/introduction.md
源码地址:https://github.com/alibaba/DataX
安装包地址:http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
插件开发手册:https://github.com/alibaba/DataX/blob/master/dataxPluginDev.md
环境要求: JDK(1.8 以上) + Python(Python2.6.X+)


一、DataX安装

1、解压datax.tar.gz

Windows直接解压,Linux使用如下命令

#解压,目录自己定
tar -zxvf datax.tar.gz -C /opt/module/

在这里插入图片描述


2、运行自检脚本

进入解压后的bin目录,执行自检脚本,job.json脚本在job目录下

cd /opt/module/datax/bin/
python datax.py /opt/module/datax/job/job.json

自检成功后如下:

在这里插入图片描述


二、Datax-Web安装

DataX Web是在DataX之上开发的分布式数据同步工具,提供简单易用的操作界面。

环境要求:

  • MySQL (5.5+) 必选,对应客户端可以选装, Linux服务上若安装mysql的客户端可以通过部署脚本快速初始化数据库
  • JDK (1.8.0_xxx) 必选
  • Maven (3.6.1+) 必选
  • DataX 必选
  • Python (2.x) (支持Python3需要修改替换datax/bin下面的三个python文件,替换文件在doc/datax-web/datax-python3下) 必选,主要用于调度执行底层DataX的启动脚本,默认的方式是以Java子进程方式执行DataX,用户可以选择以Python方式来做自定义的改造

下载地址:https://pan.baidu.com/s/13yoqhGpD00I82K4lOYtQhg 提取码:cpsk

源码地址:https://github.com/WeiYe-Jing/datax-web


1、解压DataXWeb安装包

tar -zxvf datax-web-2.1.2.tar.gz

在这里插入图片描述

将目录更名为datax-web,方便后续操作

mv datax-web-2.1.2 datax-web

2、执行一键安装脚本

进入解压后的目录,找到bin目录下面的install.sh文件,如果选择交互式的安装,则直接执行

cd datax-web
./bin/install.sh

在交互模式下,对各个模块的package压缩包的解压以及configure配置脚本的调用,都会请求用户确 认,可根据提示查看是否安装成功,如果没有安装成功,可以重复尝试; 如果不想使用交互模式,跳过确认过程,则执行以下命令安装 。

./bin/install.sh --force

这里为了简便,就不使用交互式安装,如果服务上安装有mysql命令,在执行安装脚本的过程中则会出现以下提醒:

在这里插入图片描述

填写完后完成安装 。

如果服务上并没有安装mysql命令,则可以取用目录下/bin/db/datax-web.sql脚本去手动执行。

在这里插入图片描述

完成后修改相关配置文件,主要包括控制器datax-admin/conf/application.yml和执行器datax-executor/conf/application.yml,这里我就不介绍了,后面我会写到源码打包,和那里配置是一样的。


3、启动服务

./bin/start-all.sh

在这里插入图片描述

一键取消所有服务

./bin/stop-all.sh

运行项目

访问: http://ip:9527/index.html ,输入用户名 admin 密码 123456访问系统

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/69382.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

五、伊森商城 前端基础-Vue Vue脚手架原理与使用 p27

目录 Vue项目结构 一、使用vue脚手架进行模块化开发 1、main文件 1.1、首先new Vue创建了一个vue实例,这个实例挂载了index.html中的app元素 1.2、使用了路由,这个路由是简写的写法 1.3、components使用了一个组件叫App 1.4、最终渲染 2、App.vu…

卷积神经网络相关模型

卷积神经网络相关模型1. CNN架构2. CNN架构模型2.1LeNet模型2.2Alexnet模型2.3VGG16模型2.3.1 使用多层小卷积核代替一层大的卷积核优点2.3.2 使用1*1卷积核优点2.3.2 模型特点卷积神经网络基本概念相关知识连接 卷积神经网络基本概念相关知识连接 1. CNN架构 模型分为2部分【…

ubuntu1804在rviz中显示kitti数据集的2D检测框和激光雷达的3D检测框

之前所做的工作参考上篇博客ubuntu1804发布kitti数据集的gps资料,imu资料(包含发布图片,点云过程)_FYY2LHH的博客-CSDN博客 本次将详解如何在ros播放的kitti数据集上作出检测框,首先需要知道的是对于kitti数据集中的每一帧都必须提前进行标注,而这个工作已经被别人完成了…

42. Python range函数—生成器函数

42. range函数—生成器函数 文章目录42. range函数—生成器函数1. 什么是range( )函数2. 回顾列表切片的语法3. range( )函数的语法3. range函数实操3.1 只有1个参数3.2 有2个参数3.3 有3个参数3.4 步长为负数4. list不能完全替代range5. 总结1. 什么是range( )函数 range[reɪ…

基于遗传算法在机器人路径规划中的应用研究(Matlab代码实现)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…

第十七章 优先队列优化Dijkstra算法

第十七章 优先队列优化Dijkstra算法一、普通dijkstra算法的缺陷1、选出最小距离的过程:2、松弛所有点的过程:二、如何优化1、代码模板(1)问题:(2)模板:2、详细解读三、优化分析1、使…

5G赋能行业应用,助推数智化转型!

导语 | 5G 技术的蓬勃发展推动其行业应用的巨轮乘风破浪、扬帆启航,5G 技术不断落地布局于各行各业,基础建设也不断完善,5G to B 的时代已经到来。此次,我们邀请到了中国电信研究院工业互联网技术研发部主任、腾讯云 TVP 谭华老师…

知识图谱-KGE-语义匹配-双线性模型(打分函数用到了双线性函数)-2014:TATEC

【paper】 Effective Blending of Two and Three-way Interactions for Modeling Multi-relational Data 【简介】 本文是法国 Antoine Bordes 团队发表在 ECML-PKDD 2014 上的工作,提出了 TATEC(Two and Three-way Embeddings Combination)…

ERP+MES集成管理系统重要性有哪些?

随着企业信息化观念的提升,管理方式也愈来愈信息化,因此以信息化推动企业的不断发展趋势已变成企业存活和发展的主要核心理念。其中ERP 系统和 MES 系统在企业发展和改革中起着非常重要的作用。当各种信息化系统在企业内各个部门顺利执行的同…

RabbitMQ安装教程(超详细)

本教程是在centos8下试验的,其实linux系统的都差不多 RabbitMQ官方:Messaging that just works — RabbitMQ RabbitMQ是开源AMQP实现,服务器端用Erlang语言编写,Python、Ruby、 NET、Java、JMS、c、PHP、action screcrive AMQP …

python 爬虫入门该怎么学习?

前言 1、什么是爬虫和爬虫的基本逻辑 “爬虫”是一种形象的说法。互联网比喻成一张大网,爬虫是一个程序或脚本在这种大网上爬走。碰到虫子(资源),若是所需的资源就获取或下载下来。这个资源通常是网页、文件等等。可以通过该资源…

Android NDK 开发之 CMake 必知必会

Android Studio 从 2.2 版本起开始支持 CMake ,可以通过 CMake 和 NDK 将 C/C 代码编译成底层的库,然后再配合 Gradle 的编译将库打包到 APK 中。 这意味就不需要再编写 .mk 文件来编译 so 动态库了。 CMake 是一个跨平台构建系统,在 Android Studio 引…

12月7日 补充数据库链式操作,只生成sql语句,不执行sql的几种函数以及thinkphp中验证器

补充知识: 生成sql语句但是不会执行sql语句 public function fetchSqlTest(){$result Db::name(user)->fetchSql(true)->select();//dump($result);//使用正常select查询默认中select(true)改为false即可返回sql语句$result Db::name(user)->…

UNIX/LINUX操作系统内核结构

通用操作系统的现状和分类 UNIX操作系统的根本特点:分时多用户、开放性 基本功能特征 系统结构 操作系统核心 系统调用的集合及实现系统调用的内部算法就形成操作系统核心 系统调用 以函数形式提供给核外的命令和上层应用系统使用的一组程序,涵…

观察者模式

目录 一、观察者模式解决了哪些问题: 二、体检的小栗子 三、什么是观察者模式 四、代码实现 一、观察者模式解决了哪些问题: 对象之间的一对多依赖关系应该在不使对象紧密耦合的情况下定义。应该确保当一个对象改变状态时,自动更新无限数…

5-5:显示系统的通知

通知列表 显示评论、点赞、关注三种类型的通知。 通知详情 分页显示某一类主题所包含的通知。 未读消息 在页面头部显示所有的未读消息数量 通知存在message表里面 修改MessageMapper.java package com.nowcoder.community.dao;import com.nowcoder.community.entity.Messa…

毕业2年,跳槽到我们公司拿18K,这就是00后卷王带来的压迫感吗?

内卷,是现在热度非常高的一个词汇,随着热度不断攀升,隐隐到了“万物皆可卷”的程度。 在程序员职场上,什么样的人最让人反感呢? 是技术不好的人吗?并不是。技术不好的同事,我们可以帮他。 是技术太强的人吗?也不…

AI 也会写代码了,但我并不担心

如果你比较关注人工智能,可能会注意到最近圈子的人都在刷屏一个 AI 玩意,叫 ChatGPT 。我一直关注的和菜头在他的公众号槽边往事上就接连写了几篇文章。为什么和菜头是男的,读者却要叫他“婶婶”怎么把AI逼到生气水文与干货如果看完上面的第一…

一行代码 网页变灰

背景 想必大家都感受到了,很多网站、APP 在昨天都变灰了。 先来感受一下变灰后的效果。 让网页变为黑白配色,是个常见的诉求。而且往往是突如其来的诉求,是无法预知的。 当发生这样的需求时,我们需要迅速完成变更发布。 这种…

机器学习 决策树 随机森林

文章目录参考决策树指标基尼系数基础公式公式理解引入划分后的公式划分后公式的理解信息熵、信息增益如何理解信息熵两种指标的对比总结参考 b站视频 【决策树、随机森林】附源码!!超级简单,同济大佬手把手带你学决策树决策树模型及案例&…