【数据湖架构】Azure 数据湖分析(Azure Data Lake Analytics )概述

news2024/11/25 0:25:09

在本文中,我们将探索 Azure 数据湖分析并使用 U-SQL 查询数据。

Azure 数据湖分析 (ADLA) 简介


Microsoft Azure 平台支持 Hadoop、HDInsight、数据湖等大数据。通常,传统数据仓库存储来自各种数据源的数据,将数据转换为单一格式并进行分析以做出决策。开发人员使用可能需要更长时间进行数据检索的复杂查询。组织正在增加他们在云基础架构中的足迹。它利用了云基础设施仓库解决方案,例如 Amazon RedShift、Azure Synapse Analytics(Azure SQL 数据仓库)或 AWS 雪花。云解决方案具有高度可扩展性和可靠性,可支持您的数据、查询处理和存储需求。

数据仓库遵循Extract-Transform-Load机制进行数据传输。

  • 提取:从不同的数据源中提取数据

  • 转换:将数据转换为特定格式

  • 加载:将数据加载到预定义的数据仓库模式、表中

fb7d0998ae08ad4c3aa3631e5fe18a47.png

数据湖不需要严格的模式,并在分析之前将数据转换为单一格式。它以原始格式存储数据,例如二进制、视频、图像、文本、文档、PDF、JSON。它仅在需要时转换数据。数据可以是结构化、半结构化和非结构化格式。

edf9f4bc088c15c0f96497bf6d652c39.png

数据湖的一些有用功能是:

  • 它存储原始数据(原始数据格式)

  • 它没有任何预定义的schema

  • 您可以在其中存储非结构化、半结构化和结构化

  • 它可以处理 PB 甚至数百 PB 的数据量

  • 数据湖在读取方法上遵循模式(schema ),根据需求对数据进行转换

概括地说,Azure 数据平台体系结构如下所示。图片参考:微软文档

  • 摄取:从各种数据源收集数据并以其原始格式存储到 Azure 数据湖中

  • 存储:将数据存储到 Azure Data Lake Storage、AWS S3 或 Google 云存储

  • 处理:将原始存储中的数据处理成兼容的格式

  • 分析:使用存储和处理的数据执行数据分析。您可以使用 Azure 数据湖分析 (ADLA)、HDInsight 或 Azure Databricks

e0ce01949d6e475fea85fa8373b006ce.jpeg

本文 :https://architect.pub/overview-azure-data-lake-analytics
讨论:知识星球【首席架构师圈】或者加微信小号【ca_cto】或者加QQ群【792862318】
公众号

【jiagoushipro】
【超级架构师】
精彩图文详解架构方法论,架构实践,技术原理,技术趋势。
我们在等你,赶快扫描关注吧。
1eb5d94aa606762b2be542c82a715072.jpeg
微信小号

【ca_cea】
50000人社区,讨论:企业架构,云计算,大数据,数据科学,物联网,人工智能,安全,全栈开发,DevOps,数字化.

35532f667ee4d6384fd702fcfcc9d4c9.jpeg

QQ群

【285069459】深度交流企业架构,业务架构,应用架构,数据架构,技术架构,集成架构,安全架构。以及大数据,云计算,物联网,人工智能等各种新兴技术。
加QQ群,有珍贵的报告和干货资料分享。

3867297b027df6fb33d9d8cea5cf99d2.jpeg

视频号【超级架构师】
1分钟快速了解架构相关的基本概念,模型,方法,经验。
每天1分钟,架构心中熟。

97f488bbc78b424c36883e6af16a46b3.jpeg

知识星球【首席架构师圈】向大咖提问,近距离接触,或者获得私密资料分享。

f2c9569d96662ec72f38cb41c0a44733.jpeg

喜马拉雅【超级架构师】路上或者车上了解最新黑科技资讯,架构心得。【智能时刻,架构君和你聊黑科技】
知识星球认识更多朋友,职场和技术闲聊。知识星球【职场和技术】
领英Harryhttps://www.linkedin.com/in/architect-harry/
领英群组领英架构群组
https://www.linkedin.com/groups/14209750/
微博‍‍【超级架构师】智能时刻‍
哔哩哔哩【超级架构师】

33273c7ff88cdd56c0133c4e29c25eea.jpeg

抖音【cea_cio】超级架构师

a1092e1904b0582c207acf285a95e85c.jpeg

快手【cea_cio_cto】超级架构师

ba4a2638f9caa933c7ea6415d3c70f23.jpeg

小红书【cea_csa_cto】超级架构师

66979d518d37698be470ee8cdc68d970.jpeg

网站CIO(首席信息官)https://cio.ceo
网站CIO,CTO和CDOhttps://cioctocdo.com
网站架构师实战分享https://architect.pub   
网站程序员云开发分享https://pgmr.cloud
网站首席架构师社区https://jiagoushi.pro
网站应用开发和开发平台https://apaas.dev
网站开发信息网https://xinxi.dev
网站超级架构师https://jiagou.dev
网站企业技术培训https://peixun.dev
网站程序员宝典https://pgmr.pub    
网站开发者闲谈https://blog.developer.chat
网站CPO宝典https://cpo.work
网站首席安全官https://cso.pub    ‍
网站CIO酷https://cio.cool
网站CDO信息https://cdo.fyi
网站CXO信息https://cxo.pub

谢谢大家关注,转发,点赞和点在看。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/630378.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Ae 入门系列之十三:运动跟踪与稳定

运动跟踪,通过跟踪对象的运动,然后将跟踪数据应用到另一个对象,从而可创建图层或效果在其中跟随运动的合成。 稳定运动,同样须先跟踪,之后将跟踪数据反向运用到图层自身,从而达到稳定画面的效果。 跟踪与稳…

web应用常见7大安全漏洞,浅析产生的原因!

今天整理了关于web前端的干货知识,web应用常见的有哪些安全漏洞呢,这些漏洞产生的原因又是什么呢?这些问题你想过吗? 1.SQL 注入 SQL 注入就是通过给 web 应用接口传入一些特殊字符,达到欺骗服务器执行恶意的 SQL 命…

基数排序详解(Radix sort)

本文已收录于专栏 《算法合集》 目录 一、简单释义1、算法概念2、算法目的3、算法思想4、算法由来 二、核心思想三、图形展示1、宏观展示2、微观展示 四、算法实现1、实现思路2、代码实现3、运行结果 五、算法描述1、问题描述2、算法过程3、算法总结 六、算法分析1、时间复杂度…

创新指南|如何优化创新ROI? 亟需从双模创新衡量着手

不确定性和风险是创新投资的常态,这让企业领导者和创新团队面临着一个共同的挑战:如何衡量创新ROI?本文将探讨如何在高风险创新中实现回报,需要采用探索和开发的双模机制。在这个快速变化的市场中,企业创新为了实现可持…

rk3568 SD卡启动

rk3568 SD卡启动 SD卡启动系统,它可以让rk3568在没有硬盘或其他存储设备的情况下启动和运行操作系统。这使得rk3568变得与树梅派一样灵活切换系统,与此同时进行故障排查和修复,而不需要拆卸设备或者使用专业的烧录工具。SD卡启动还可以方便地…

Git 安装并初始化 + 官网下载速度太慢的问题

目录 1. 快速下载 2. 初始化 1. 快速下载 当你兴致勃勃地去官网下载 git 的时候,突然发现,嗯??下载完成还需 9 个小时? 快速下载地址,请点这里! 打开之后是这个样子: 我们可以自…

Rocketmq 一文带你搞懂rocketmq基础

1.集群架构 从上图可以看出来一共有4个部分,分别为Producer,Consumer,NameServer,Broker 1.1 NameServer集群 虽然说NameServer是一个集群,但是每一个NameServer是独立的,不会相互同步数据,因为每个节点都会保存完整的数据&#…

音质好的骨传导蓝牙耳机有哪些,十大公认音质好的骨传导耳机

​骨传导耳机是将声音转化为不同频率的机械振动,通过人的颅骨、骨迷路、内耳淋巴液、螺旋器、听觉中枢来传递声波。由于不需要像入耳式或入耳式耳机一样堵住耳朵来避免听力受损,也不会因为在听音乐的时候塞住耳朵而影响到旁边人的交流,所以骨…

LeetCode_Day5 | 有效的字母异位词、两个数组的交集、快乐数!

LeetCode_哈希表 242.有效的字母异位词1.题目描述2.题解 349.两个数组的交集1.题目描述2.题解 202.快乐数1.题目描述2.题解思路(官方题解啊!看了好几遍真难) 算法代码实现复杂度分析 242.有效的字母异位词 1.题目描述 给定两个字符串 s 和 t ,编写一个…

滑块验证码------啥?你居然还在手动滑动,你不来试试自动滑动吗

测试网站 测试网站:https://www.geetest.com/demo/slide-float.html 我的giteer:秦老大大 (qin-laoda) - Gitee.com里面有我写的代码 作者备注:由于我个人原因,文章写得感觉太长,后面我会把一个知识分成多部文章,这样可以简单明了的看到了 验证码的思路有两种:一种是通过se…

港科夜闻|香港科大取得重大科研突破,首度利用人工智能为阿尔兹海默症作早期风险预测...

关注并星标 每周阅读港科夜闻 建立新视野 开启新思维 1、香港科大取得重大科研突破,首度利用人工智能为阿尔兹海默症作早期风险预测。香港科大校长叶玉如教授及香港科大陈雷教授带领的研究团队,最近开发了一套人工智能模型,利用遗传信息&…

WTM框架运行报错0308010C:digital envelope routines::unsupported

WTM框架运行报错0308010C:digital envelope routines::unsupported 错误描述报错原因解决方式 错误描述 我所使用WTM搭建的程序是选择的.net5.0Vue前后端分离的方式,项目结构选择的是“各层分离的多个项目”;本人并非初次使用WTM平台框架搭建项目&#…

usb 电气特性

usb 电气特性 usb 的连线 在usb 3.0 之前都有插拔方向的 只有一边有接触点 标准usb连线使用4芯电缆: 5v电源线(VBus)、差分数据线负(D-)差分数据线正(D)及地线(GND)主要传输数据就是中间二个 D 和D- usb的数据传输…

基于 Wav2Lip-GFPGAN 深度学习模型的数字人Demo

写在前面 工作中遇到简单整理博文为 Wav2Lip-GFPGAN 环境搭建运行的 Demo理解不足小伙伴帮忙指正 对每个人而言,真正的职责只有一个:找到自我。然后在心中坚守其一生,全心全意,永不停息。所有其它的路都是不完整的,是…

人工智能(pytorch)搭建模型10-pytorch搭建脉冲神经网络(SNN)实现及应用

大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型10-pytorch搭建脉冲神经网络(SNN)实现及应用,脉冲神经网络(SNN)是一种基于生物神经系统的神经网络模型,它通过模拟神…

ASP.NET Core Web API入门之二:Swagger详细使用

ASP.NET Core Web API入门之二:Swagger详细使用 一、引言二、Swagger的作用以及优点2.1 作用2.2 优点 三、API接口添加注释3.1 编辑项目文件3.2 修改 Startup.cs 文件的 ConfigureServices 方法3.3 修改浏览器的网页标题3.4 接口添加注释 四、运行后效果 一、引言 …

(六)矢量数据的空间分析——缓冲区分析

矢量数据的空间分析——缓冲区分析 目录 矢量数据的空间分析——缓冲区分析 1.基本概念1.1图解1.2缓冲距离1.2.1固定距离1.2.2由字段决定的距离 2.缓冲区的建立2.1操作步骤2.1.1点状要素建立缓冲区2.1.2面状要素建立缓冲区 缓冲区是一组或一类地图要素(点、线、面&a…

1.Tocmcat部署

文章目录 Tomcat部署介绍部署Tomcat安装jdk安装Tomcat添加tomcat系统服务 Tomcat部署虚拟主机tomcat多实例部署 Tomcat部署 Tomcat安装部署虚拟主机配置Tomcat优化 介绍 免费的、开放源代码的Web应用服务器Apache软件基金会(Apache Software Foundation)Jakarta项目中的- -个…

华为OD机试真题B卷 JavaScript 实现【5键键盘的输出】,附详细解题思路

一、题目描述 有一个特殊的5键键盘,上面有a,ctrl-c,ctrl-x,ctrl-v,ctrl-a五个键。 a键在屏幕上输出一个字母a;ctrl-c将当前选择的字母复制到剪贴板;ctrl-x将当前选择的字母复制到剪贴板&#…

【算法系列之哈希表I】leetcode15. 三数之和

242.有效的字母异位词 力扣题目链接 给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。 **注意:**若 s 和 t 中每个字符出现的次数都相同,则称 s 和 t 互为字母异位词。 输入: s "anagram", t "nag…