【Azure 架构师学习笔记】-Azure Data Factory (1)-调度入门

news2025/7/7 6:59:28

本文属于【Azure 架构师学习笔记】系列。
本文属于【Azure Data Factory】系列。

前言

在开发好一个ADF pipeline（功能）之后，需要将其按需要运行起来，这个称之为调度。下图是一个简单的ADF 运作图，按照需要的顺序，由某个程序或者人，调度Data Factory Service里面的pipelines。这些pipelines是在Data Factory Service中定义和存储的。然后通过pipeline中具体的活动（Activity，比如copy）访问Linked Services，然后从Source中获取数据，写入Sink中。
在这里插入图片描述

简要说明途中几个关键组件：

Linked Service: 与外部资源的连接。
Dataset: 链接服务器指定了连什么资源，而Dataset指定了资源怎么展示。 Dataset可以是DB 里面的表（或子集），也可以是ADLS 上CSV文件的列，格式定义等。
Integration Runtime: 实际上就是计算引擎，ADF是一个云“服务”，它更偏向于设计和调度，并不适合做太多运算，所以需要借助外部资源来实现。这就是所谓的集成运行时（Integration Runtime, IR) 。
Pipeline: ADF的核心，是操作的一个集合或者容器，跟Logic Apps的workflow类似。ADF几乎所有实际操作都有pipeline来实现。
Data Flows: ADF 有两大类操作（活动， activity），一类是copy，用于简单的文件传输。另外一种则是Data Flows，它包含了大量的活动，这些活动用于操作数据，处理逻辑等。相对于copy 活动， data flows更适合用于大数据处理，因为它的后台正是使用了Azure Databricks的引擎。

在设计好pipeline之后，就需要按需调度起来。ADF 调度，用的是trigger，由于ADF 的操作都需要被封装在pipeline里面，trigger通过管理pipeline的运行方式来实现调度。包括启停，循环次数等。和Logic Apps类似，它同样可以实现分钟，小时，日，周，月的频率触发。不过配置时要注意时区，因为云计算是基于全球，所以默认都是UTC时间。

除了定时之外，还能被事件触发，比如访问HTTP/s端点，推送消息到Azure Storage queue，文件到达ADLS等。

下面来演示一下。

配置trigger

首先进入特定的pipeline，然后按下图【添加触发器】：

在这里插入图片描述
在配置界面，可以看到一些常见的配置项，这跟Logic Apps中的调度配置类似：

在这里插入图片描述
同样类似的还有时间间隔，也就是“重复” 里面的间隔单位选择，当选择天，周，月时，就会出现“高级定期选项”，如下图。这里可以指定到具体的执行行为，可以和这篇文字对比着看：【Azure 架构师学习笔记】-Azure Logic Apps（7）- 自定义Logic Apps 调度。

在这里插入图片描述

注意：这些trigger会在你“发布”之后才生效，而不是在你保存的时候。

在保存之后可以看到界面上出现了一个“1”的符号，证明添加了一个新的内容：
在这里插入图片描述

导航到这个位置就能看到是我们刚才配置的触发器。
在这里插入图片描述

同时在monitor界面也可以看到一些pipeline和trigger的信息。不过由于演示并没有发布，所以这里没有实际运行。

在这里插入图片描述

小结

本文简单演示了ADF 的调度入门。下文会对其进行更多的介绍。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/360246.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

uniapp 原生安卓开发插件（module），以及android环境本地调试（二）

uniapp 原生安卓开发插件（module），以及android环境本地调试（二）

uniapp 原生安卓开发插件（module），以及android环境本地调试（一） 1、前景承接上一篇文章，由于uniapp每天只有限定的打包次数，所以每次插件调试都打包成为基座，这个不太方便&#x…

阅读更多...

java 集合常见面试(一)

java 集合常见面试(一)

集合概述 java集合预览 Java 集合， 也叫作容器，主要是由两大接口派生而来：一个是 Collection接口，主要用于存放单一元素；另一个是 Map 接口，主要用于存放键值对。对于Collection 接口，下面又有…

阅读更多...

预告｜第四届OpenI/O启智开发者大会NLP大模型论坛强势来袭！

预告｜第四届OpenI/O启智开发者大会NLP大模型论坛强势来袭！

最近，ChatGPT刷爆了所有人的朋友圈。它不仅能够与人类进行日常自然的聊天，还能胜任如写论文、编代码等诸多较为复杂的语言工作。ChatGPT 爆火的背后，是NLP(自然语言处理)技术的飞速革新。在过去的十年里，人工神经网络计算的加入、…

阅读更多...

#461 年轻人的世界没有容易二字，除了脱发

#461 年轻人的世界没有容易二字，除了脱发

点击文末“阅读原文”即可收听本期节目剪辑、音频 / 卷圈编辑 / SandLiu 卷圈监制 / 姝琦文案 / 粒粒产品统筹 / bobo 录音间 / 声湃轩提起二月二，你一定会脱口而出“龙抬头”。龙抬头吃什么很重要，重要到可以吵一架，但比吃什么更重要…

阅读更多...

echo和swagger的结合使用（oapi-codegen使用）

echo和swagger的结合使用（oapi-codegen使用）

echo和swagger的结合使用（oapi-codegen使用） 相关官网： echo官网swagger 这里介绍的重点是swagger和echo的整合使用，具体的框架的使用方法请看官方文档。 1. 初衷 swagger官网提供了文档转代码的操作，但转出来的代…

阅读更多...

Allegro如何通过报表的方式检查单板上是否有假器件操作指导

Allegro如何通过报表的方式检查单板上是否有假器件操作指导

Allegro如何通过报表的方式检查单板上是否有假器件操作指导在做PCB设计的时候，输出生产文件之前，必须保证PCB上不能存在假器件，如下图，是不被允许的当PCB单板比较大，如何通过报表的方式检查是否存在假器件，具体操作如下点击Tools点击Reports

阅读更多...

你看，ChatGPT都知道优先使用BigDecimal

你看，ChatGPT都知道优先使用BigDecimal

不是三婶儿偏执，非要吐槽。家人们，咱就是说，按照基操逻辑谁会把严格金额计算相关的数据使用double类型呢… “我以为吕布已经够勇猛了，这是谁的部下？” 前几天，一同事让帮忙写段代码。内容比较常规&#xf…

阅读更多...

iTerm2 的配置与美化

iTerm2 的配置与美化

前言 iTerm2是默认终端的替代品，也是目前Mac系统下最好用的终端工具，集颜值和效率于一身。最近换了一台新的 MacBook Pro ，需要重装电脑上的常用软件。为了将 ITerm2 DIY为自己喜欢的样子，花了不少时间。为了方便下次再配置&…

阅读更多...

python五子棋代码最简单的,python五子棋代码画棋盘

python五子棋代码最简单的,python五子棋代码画棋盘

大家好，本文将围绕python五子棋代码输赢逻辑判断展开说明，如何用python制作五子棋游戏是一个很多人都想弄明白的事情，想搞清楚python五子棋代码最简单的需要先了解以下几个事情。 1、求解用python 编写五子棋怎样编写判断输赢的函数&#xff…

阅读更多...

C++项目——高并发内存池（1）--介绍及定长内存池

C++项目——高并发内存池（1）--介绍及定长内存池

1.什么是内存池 1.1 池化技术将程序中需要经常使用的核心资源先申请出来，放在一个池内，由程序自己管理，这样可以提高资源的使用效率，也可以保证本程序占有的资源数量。比如之前博文实现的线程池，就是预先的申请出…

阅读更多...

CRM哪家好？这5个CRM管理系统很好用！

CRM哪家好？这5个CRM管理系统很好用！

CRM哪家好？这5个CRM管理系统很好用！ CRM(Customer Relationship Management)即客户关系管理，能够帮助提高客户的价值、满意度、赢利性和忠实度，缩减销售周期和销售成本、增加收入、寻找扩展业务所需的新的市场和渠道，…

阅读更多...

浅谈c++引用

浅谈c++引用

浅谈c 在这里开设 <<浅谈C>> 系列专题,针对C重点内容展开探讨与观察底层,同时也是一个面试专栏,所选知识大多为面试常见问题.前期较为基础,难度会逐渐上升哦~ 本专栏采用经典的哲学三段论编写:是什么|为什么|怎么做力图精简,高效. 第一章: 浅谈C函数重载传送门…

阅读更多...

ansible剧本（playbook）

ansible剧本（playbook）

目录一、playbooks 概述以及实例操作 1、playbooks 的组成 2、操作示例一： 2.1 编写yaml文件也就是playbook 2.2 修改配置文件并放入/opt/目录下 2.3 运行playbook 3、操作实例二：定义、引用变量 4、操作示例三：指定远程主机sudo切换…

阅读更多...

音频格式、参数、开发相关总结

音频格式、参数、开发相关总结

常见的语音格式介绍PCM：音频纯裸数据。WAV：微软在windows存储的一种纯裸数据格式。AIFF：苹果在Mac上存储的一种纯裸数据格式。MP3：为ISO/IEC国际标准，是现在最普及的一种数字音频编码和有损压缩格式，几乎所…

阅读更多...

Android Spider XX兔 Wechat Cookie 校验注册案例（二）

Android Spider XX兔 Wechat Cookie 校验注册案例（二）

声明此次案例只为学习交流使用，抓包内容、敏感网址、数据接口均已做脱敏处理，切勿用于其他非法用途； 文章目录声明前言一、资源推荐二、任务说明三、App抓包分析四、还原JS加密1、Date类2、MD5类3、组合调用还原 api_token 参数4、execjs模…

阅读更多...

04- 图像卷积及图片的模糊和边缘检测 (OpenCV基础) (机器视觉)

04- 图像卷积及图片的模糊和边缘检测 (OpenCV基础) (机器视觉)

知识重点 padding指的就是填充的0的圈数重构图片大小: img cv2.resize(img, dsize(300, 300))模糊操作: dst cv2.filter2D(img, -1, kernel) kernel np.ones((5, 5), np.float32)/ 25 dst cv2.filter2D(img, -1, kernel) # 卷积操作模糊操作: 方盒滤波: dst cv2.b…

阅读更多...

AD使用教程图文并茂 AD2020四层板

AD使用教程图文并茂 AD2020四层板

文章目录设计流程图：资源下载：自定义快捷键：（按照个人习惯）默认快捷键：一、软件主页面1.主界面2.Panels面板3.系统设置3.自定义快捷键4.新建工程二、原理图库1.原理图库面板2.管脚属性三、原理图绘制绘制步…

阅读更多...

C++011-C++循环+枚举

C++011-C++循环+枚举

文章目录C011-C循环枚举枚举枚举思想枚举举例题目描述统计因数题目描述质数判定错误方法一：优化方法1： 用break实现优化优化方法2： sqrt(n)题目描述水仙花数题目描述 7744问题实现方法1优化方法2题目描述余数相同问题题目描述特殊自然数…

阅读更多...

《第一行代码》第六章：数据库与存储方案

《第一行代码》第六章：数据库与存储方案

一，持久化技术简介也就是数据存储在内存中，会丢失。需要存储在存储设备中。而持久化技术，就是提供了手段，让数据再试瞬时状态和持久状态之间转换。安卓开发提供了三种数据的持久化技术： 二，文件存储 …

阅读更多...

【HDFS】FsDatasetImpl#getReplicaVisibleLength

【HDFS】FsDatasetImpl#getReplicaVisibleLength

调用点 DataNode.getReplicaVisibleLength(ExtendedBlock) (org.apache.hadoop.hdfs.server.datanode) // ClientDataNodeProtocolBlockChecksumComputer in BlockChecksumHelper.BlockChecksumComputer(DataNode, ExtendedBlock, BlockChecksumOptions) (org.apache.hadoop.hd…

阅读更多...

推荐文章

最新文章