dataphin是什么及其简单使用示例

news2024/11/21 0:24:10

1.1dataphin是什么?

Dataphin是由阿里研发的智能大数据建设平台,提供一站式数据中台(大数据平台)建设服务。Dataphin通过沙箱(项目)实现业务及作业资源隔离,运行更快,且数据同步到Dataphin后,会统一将敏感数据脱敏后放入脱敏层,增强安全性并提高了效率。

Dataphin支持选择不同计算引擎进行数据处理,包括:MaxCompute、HadoopHive、AnalyticDB PostgreSQL、Flink,产品使用大致分成几个部分:数仓规划、数据研发、资产管理和资产服务。其服务模式包括:

1)公共云在线服务:Dataphin 支持按月订购的预付费模式,开通即可使用;

2)线下独立部署:提供一次购买软件并每年订购维保的买断式服务。

1.2页面展示

1.3核心模块

研发:报表开发及数据查询

资产:快速查询当前Dataphin有哪些数据资产

规划及管理中心:一般大数据运维及产品开发人员使用

2.dataphin使用示例

2.1准备数据源

2.1.1已有数据源

申请权限资产—>搜索相关表—>申请权限—>选择项目及对应字段

2.1.2创建MySQL数据源

通过创建MySQL数据源能够实现Dataphin读取MySQL的业务数据或向MySQL写入数据。本文为您介绍如何创建MySQL数据源。

背景信息

MySQL是一种关系型数据库。 常用于网站、应用程序和商业产品,是一种常见的主要关系数据存储系统。更多详情请参见MySQL官网。

使用限制

  • Dataphin仅支持超级管理员、数据源管理员、板块架构师、项目管理员角色创建数据源。

  • 仅支持创建5.1.43、5.6/5.7、8.0版本的MySQL数据源。

操作步骤
  1. 在Dataphin首页,单击顶部菜单栏 管理中心 。

  2. 按照下图指引,进入 新建数据源 对话框

  3. 在 新建数据源 对话框的 关系型数据库 区域,选择 MySQL 。

    如果您最近使用过MySQL,也可以在 最近使用 区域选择MySQL。同时,您也可以在搜索框中,输入MySQL的关键词,快速筛选。

  4. 在 新建MySQL数据源 对话框中,配置连接数据源参数。

    1. 配置数据源的基本信息。

      参数描述
      数据源名称命名规则如下: * 只能包含中文、字母、数字、下划线(_)或中划线(-)。 * 长度不能超过64字符。
      数据源编码配置数据源编码后,您可以在Flink_SQL任务中通过数据源编码.表名称数据源编码.schema.表名称的格式引用数据源中的表;如果需要根据所处环境自动访问对应环境的数据源,请通过${数据源编码}.table${数据源编码}.schema.table的变量格式访问。更多信息,请参见Dataphin数据源表开发方式。 重要 * 目前仅支持 MySQL 、 Hologres 、 MaxCompute 数据源。 * 数据源编码配置成功后不支持修改。
      版本支持选择5.1.43、5.6/5.7和8.0版本。
      数据源描述对MySQL数据源的简单描述。不得超过128个字符。
      数据源配置基于业务数据源是否区分生产数据源和开发数据源: * 如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源 。 * 如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源 。
      标签您可根据标签给数据源进行分类打标,如何创建标签,请参见数据源管理标签。
    2. 配置数据源与Dataphin的连接参数。

      若您的数据源配置选择 生产+开发数据源 ,则需配置 生产+开发数据源 的连接信息。如果您的数据源配置为 生产数据源 ,仅需配置 生产数据源 的连接信息。说明

      通常情况下,生产数据源和开发数据源需配置非同一个数据源,以使开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。

      参数描述
      JDBC URL链接地址的格式为jdbc:mysql://host:port/dbname。 说明 MySQL数据源的默认端口为3306。
      用户名 、 密码数据库的 用户名 和 密码 
      SSL加密开启后,需上传Truststore证书并填写Truststore证书密码。
    3. 配置数据源的高级设置。

      参数描述
      connectTimeout数据库的connectTimeout时长(单位ms),默认900000毫秒(15分钟)。 说明 * 若您在JDBC URL中带有connectTimeout配置,则connectTimeout为JDBC URL中配置的超时时间。 * Dataphin V3.11版本之前的创建数据源,connectTimeout默认为-1,表示无超时限制。
      socketTimeout数据库的socketTimeout时长(单位ms),默认1800000毫秒(30分钟)。 说明 * 若您在JDBC URL中带有socketTimeout配置,则socketTimeout为JDBC URL中配置的超时时间。 * Dataphin V3.11版本之前的创建数据源,socketTimeout默认为-1,表示无超时限制。
      连接重试次数数据库连接超时,将自动重试连接直到完成设定的重试次数。若达最大重试次数仍未连接成功,则连接失败。 说明 * 默认重试次数为 1次 ,支持配置 0~10 之间参数。 * 连接重试次数将默认应用于 离线集成任务 与 全域质量 (需开通资产质量功能模块),离线集成任务中支持单独配置任务级别的重试次数
  5. 单击 测试连接 ,测试数据源是否可以和Dataphin进行正常的连通。

  6. 测试成功后,单击 确定 ,完成MySQL数据源的创建。

2.2 数据查询

步骤:选择沙箱—>创建文件夹及页面—>写SQL脚本保存并执行

2.3创建离线管道(抽取数据)

(多数据源同步到一个或多个目标数据源)

步骤一:创建离线单条管道

  1. 进行数据集成页面。

  2. 在数据集成页面,按照下图操作指引,进入 创建管道开发脚本 对话框。

  3. 在 创建管道开发脚本 对话框中,配置管道相关参数。

    参数描述
    管道名称填写管道名称。 命名规则:支持最长64个字符,不支持以下特殊字符:`
    调度类型选择管道的调度类型。 调度类型 包括: * 周期性节点  指需定期执行的任务。 * 手动节点  指没有依赖关系,需手动触发的任务。
    描述填写对离线单条管道的简单描述。
    选择目录默认选择为离线管道。同时您也可以在离开管道页面创建目标文件夹后,选择该目标文件夹为离线管道任务的目录。 
  4. 单击 确定 

步骤二:开发离线管道脚本

离线单条管道采用可视化组件的开发方式,您可通过单击画布侧边栏 组件库 ,选择所需组件类型后拖拽组件到管道开发画布中,开发管道脚本。如下图所示:

  • 组件类型: 组件库分为5种组件类型,包括 输入 、 转换 、 流程 、 输出  自定义 。各组件类型使用场景各不相同,您可根据业务需求选择所需组件类型进行开发。

  • 组件: 开发管道脚本的功能模块,各组件对应不同的功能。

步骤三:管道调度配置

  1. 单击开发画布菜单栏按钮,进行调度配置。

  2. 在调度配置页面,配置集成管道的 基本信息 、 调度配置 、 调度依赖 、 调度参数、运行配置 。各配置说明如下:

    • 基本信息 :通过集成管道基本信息,您可配置集成管道任务开发负责人、运维负责人及描述。

    • 调度配置 :对于 周期性节点 ,调度配置用于定义集成管道任务在生产环境的调度方式。您可以通过调度属性,配置集成管道任务的调度类型、调度周期、调度逻辑与执行等。

    • 调度依赖 :对于 周期性节点, 调度依赖用于定义集成管道任务在调度任务中的依赖节点。Dataphin通过各个节点的调度依赖的配置结果,有序的运行业务流程中各个节点,保障业务数据有效、适时地产出。

    • 运行配置: 您可根据业务场景为该集成管道任务配置任务级的运行超时时间和任务运行失败时的重跑策略,杜绝因计算任务长时间资源占用造成资源浪费的同时提高计算任务运行的可靠性。

    • 资源配置 :您可为当前离线集成任务配置所属资源组,该离线集成任务将使用该资源组资源进行任务调度。

步骤四:保存并提交离线集成任务

  1. 单击画布上方的图标,保存管道任务。

  2. 单击画布上方的图标,在 提交备注 对话框,填写备注信息后,单击 确定并提交 。

    说明

    确认并提交离线集成任务后,系统将自动检查提交的离线集成任务,检查项包括配置检查、权限检查、 表重复性检查。

    • 配置检查: 包括管道检查和组件检查,检查配置项完整性。

    • 权限检查: 包括检查数据源、表、及字段的权限;密钥使用权限;质量规则发布权限。

    • 表重复性检查: 包括检查管道中的来源表是否在已提交或已发布的任务中已作为来源表,以及管道中的目标表是否在已提交或已发布的任务中已作为来目标表。

    若提交的集成任务中,存在以上检查项的告警或错误信息。建议您根据提示信息解决告警或错误后,在进行提交。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1798598.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【QT5】<总览一> QT环境搭建、快捷键及编程规范

文章目录 前言 一、简单介绍QT 二、安装QT Creator 三、第一个QT项目 四、常用快捷键 五、QT中的编程规范 前言 在嵌入式Linux应用层开发时,经常使用QT作为图形化界面显示工具。为学习Linux下的QT编程,在Ubuntu和开发板中搭建QT开发环境&#xff…

推荐系统三十六式学习笔记:原理篇.近邻推荐07|人以群分,你是什么人就看到什么世界

目录 协同过滤基于用户的协同过滤背后的思想原理实践1、构造矩阵2、相似度计算3、推荐计算4、一些改进 应用场景:总结 谈及推荐系统,不得不说大名鼎鼎的协同过滤。协同过滤的重点在于协同,所谓协同,也就是群体互帮互助&#xff0c…

图解通用网络IO底层原理、Socket、epoll、用户态内核态······

LInux 操作系统中断 什么是系统中断 这个没啥可说的,大家都知道; CPU 在执行任务途中接收到中断请求,需要保存现场后去处理中断请求!保存现场称为中断处理程序!处理中断请求也就是唤醒对应的任务进程来持有CPU进行需要…

Mac 使用Docker安装Elasticsearch、Kibana 、ik分词器、head

安装ElasticSearch 通过docker安装es docker pull elasticsearch:7.8.1 在本地创建elasticsearch.yml文件 mkdir /Users/ky/Documents/learn/es/elasticsearch.yml 编辑yml文件内容 http: host: 0.0.0.0 xpack.security.enabled: false xpack.security.enrollment.enabled: t…

减调食谱攻略:美味低卡又健康

早餐主要求质,也就是求营养,更确切的说是“均衡的营养,多重的营养元素”确保每天早餐不重样就差不多了。 早餐主食:蛋羹、糖心水煮蛋,皮蛋瘦肉粥、南瓜粥、小米粥,蒸煮玉米、南瓜、芋头、红薯,…

深度神经网络——什么是深度强化学习?

除了无监督机器学习和监督学习之外,人工智能创造的另一种常见形式是强化学习。除了常规的强化学习之外, 深度强化学习 由于它结合了深度学习和强化学习的最佳方面,因此可以带来令人惊讶的令人印象深刻的结果。让我们具体看看深度强化学习是如…

李廉洋:6.6黄金原油怎么看?今日行情分析及最新策略。

黄金消息面分析:美指走强未能抑制金价升势。黄金价格大幅上涨,在美国公布喜忧参半的经济数据后,金价与周二的走势发生180度大转弯,这些数据可能保证美联储设定的借贷成本降低。美国10年期基准国债收益率下跌3个基点,至…

项目进度管理必备:15款最佳项目进度跟踪工具推荐

15好用的款主流项目进度管理软件:PingCode、Worktile、Trello、Tower、Asana、Smartsheet、Teambition、ClickUp、Wrike、Monday.com、Notion、禅道、飞书、云效、蓝凌。 严格的进度管理有助于更好地控制项目进展,提升团队效率,最终实现项目成…

Android音频进阶之1.0到14.0音频焦点变化(七十六)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒体系统工程师系列【原创干货持续更新中……】🚀 优质视频课程:AAOS车载系统+AOSP…

小白学linux | 使用正则表达式审计ssh登录ip地址

Ubuntu /var/log/auth.log记录了所有与身份验证相关的事件,包括SSH登录尝试 grep -i "failed password" /var/log/auth.log | \awk {if($11 ~/^[0-9]\.[0-9]\.[0-9]\.[0-9]$/)print $11 ; else print $13} | \uniq -c | sort -nr -k1 RedHat系发行版 /va…

MK米客方德 SD NAND与文件系统:技术解析与应用指南

随着数字存储技术的飞速发展,SD NAND(贴片式T卡)已成为我们日常生活中不可或缺的存储工具。我们将深入探讨SD NAND的文件系统,特别是SD 3.0协议支持的文件系统类型,以及它们在实际应用中的作用和用户可能遇到的问题。 MK米客方德的…

微前端之旅:探索Qiankun的实践经验

theme: devui-blue 什么是微前端? 微前端是一种前端架构方法,它借鉴了微服务的架构理念,将一个庞大的前端应用拆分为多个独立灵活的小型应用,每个应用都可以独立开发、独立运行、独立部署,再将这些小型应用联合为一个完…

[pixi.js] 入门简单案例 简易时钟

老实说pixi虽然之前拿来做个几个简单的游戏,但是是好久前的了,又忘了,现在算是重新入门。 官网版本已经更新到v8去了,而react相关的pixi库pixi-react 虽然支持react18 但还是v6-v7的版本,既然已经看了v8的文档&#xf…

解决富文本中抖音视频无法播放的问题——403

问题 富文本中的抖音视频无法播放,资源状态码是403禁止访问打开控制台,可以看到在项目中打开,数据请求的请求头多了一个Referer: http://localhost:3000/而复制链接在新窗口直接打开,请求头中并不会携带Referer 解决方案 在ind…

书客护眼大路灯Sun再次引领先锋,守护青少年视力健康!

在这个信息化高速发展的时代,我们的眼睛承受着前所未有的压力。每年的护眼日,不仅是提醒我们关注眼睛健康的时刻,更是全社会共同努力,为青少年营造健康用眼环境的契机。 “守护明亮视界,预防近视从我做起”。随着国内青…

【Vue2源码学习分析】

# 文件结构 源码目录 # 调试环境搭建 安装依赖: npm i安装rollup: npm i -g rollup修改dev脚本,添加sourcemap,package.json "dev": "rollup -w -c scripts/config.js --sourcemap --environment TARGET:web- full-dev",运行开发命令…

SkyWalking之P0业务场景输出调用链路应用

延伸扩展:XX业务场景 路由标签打标、传播、检索 链路标签染色与传播 SW: SkyWalking的简写 用户请求携带HTTP头信息X-sw8-correlation “X-sw8-correlation: key1value1,key2value2,key3value3” 网关侧读取解析HTTP头信息X-sw8-correlation,然后通过SW…

Linux网络编程:网络层协议|IP

目录 前言: 1.IP协议 1.1.IP协议格式 1.2.网段划分 1.2.1.知识引入 1.2.2.IP地址划分和子网掩码 1.3.IP地址分类 1.3.1.特殊IP地址 ​编辑 1.3.2.私有IP和公网IP 1.3.3.浅谈NAT技术 1.4.路由 1.4.1.什么是路由 1.4.2.路由表 1.5.网络层数据切片和组装…

Allegro导入DXF文件

阿里狗导入DXF文件 点击File–>Import–>DXF,注意DXF file那边不能使用中文路径和文件名以及非法字符,DXF units一般为mm,结构那边一般都用mm制作图,右边三个选项只需要勾选中间那个,意思是以增加的形式导入&am…

jail管理器CBSD实践@FreeBSD

CBSD介绍 CBSD是为FreeBSD jail子系统、bhyve、QEMU/NVMM和Xen编写的管理层。该项目定位为一个综合解决方案的单一集成工具,用于使用预定义的软件集以最少的配置快速构建和部署计算机虚拟环境。 虽然CBSD没有提供额外的操作系统级功能,但它极大地简化了…