APACHE-ATLAS-2.1.0简介(二)

news2025/1/15 18:15:38

APACHE-ATLAS-2.1.0简介(一)

什么是元数据?

元数据(METADATA),用一句话定义就是:描述数据的数据。元数据打通了数据源、数据仓库、数据应用之间的壁垒,记录了数据从产生到消费的全过程。

ATLAS的问题列表

APACHE-ATLAS-STACKOVERFLOW

APACHE-ATLAS-2.1.0的版本依赖

Use Hadoop 3.1, Hive 3.1, HBase 2.0, Solr 7.5, Kafka 2.0, JanusGraph 0.5.1, Tinkerpop 3.4.6, Spring Framework 4.3.20

ATLAS的特性

(1). 元数据类型 & 实例

  • 内置各种Hadoop和非Hadoop元数据的预定义类型;
  • 能够为要管理的元数据自定义新类型;
  • 类型可以具有原始属性,复杂属性,对象引用,可以继承其他类型;
  • 类型(type)实例(称为实体entities)捕获元数据对象详细信息及其关系;
  • 提供可以更轻松地进行集成用于处理类型和实例的REST API;

(2). 分类

  • 能够动态创建分类 - 如PII,EXPIRES_ON,DATA_QUALITY,SENSITIVE;
  • 分类可以包含属性 - 例如EXPIRES_ON分类中的expiry_date属性;
  • 实体(entities)可以与多个分类(classifications)相关联,从而实现更轻松的发现和安全实施;
  • 通过血缘传播分类 - 自动确保分类在进行各种处理时遵循数据;

(3). 血缘

  • 直观的UI,用于在数据流转时,通过各种流程时查看数据;
  • 提供用于访问和更新血缘的REST API;

(4). 搜索/发现

  • 直观的UI,按类型(type),分类(classification),属性值(attribute)或自由文本搜索实体;
  • 提供丰富的REST API,可按复杂条件进行搜索;
  • SQL搜索实体的查询语言 - 域特定语言(DSL);

(5). 安全和数据屏蔽

  • 用于元数据访问的细粒度安全性,实现对实体实例的访问控制以及添加/更新/删除分类等操作;
  • 与APACHE RANGER集成可根据与APACHE ATLAS中的实体相关的分类对数据访问进行授权/数据屏蔽,如:
    – 谁可以访问分类为PII,SENSITIVE的数据;
    – 客户服务用户只能看到分类为NATIONAL_ID的列的最后4位数字;

ATLAS分类传播

分类传播,使得数据所关联的分类能够沿着血缘关系,从父类传递给子类。

  • 当给实体数据打上分类标签后,该实体数据的子也可以得到该分类标签;
  • 当更新实体数据上的分类标签后,该实体数据的子也会对应的修改这个分类标签;
  • 当删除实体数据上的分类标签后,该实体数据的子也会对应的删除这个分类标签;
  • 当父实体数据删除时,子类所得到的这个父类的所有分类标签也会被删除;
  • 当子类到父类之间的血缘关系被破坏时,子类也会失去父类的分类标签;
  • 虽然子类到父类之间的一条血缘链中断,但是只要还有另一条血缘链存在,且使得子类可以连接到父类,那么子类就能够保存从其父类继承来的分类标签。

ATLAS模块概述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/557691.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【CANN训练营0基础赢满分秘籍】应用开发深入讲解→模型推理

1 模型离线推理 各步要解析如下: Host&Device内存管理与数据传输: Host&Device上的内存申请与释放,内存间的相互拷贝;模型加载:将离线的om文件加载到Device上;在样例的资源初始化模块中进行。模型输入输出准备∶根据禹线om的输入输出,在Device…

【记者团】社团管理手册

志愿时长🎁:团内有时会有志愿服务等活动,志愿时长可以找自己班长或班上负责人统计,记者团孙老师会和团委老师对接,团委会记录志愿时长。 志愿时长用于校级奖学金、班级奖学金、校评优评先、青马班面试(青马对入党有帮助…

大数据应用——Hive操作示例

启动Hive完成如下任务: (1)新建member表(2)将本地文件“/home/hadoop/member.txt”导入 member表中 (3)查询member表中所有记录 (4)查询member表中男同学(性别值为1)数…

炸金花底层模拟

一.说明 经常刷视频,看到一个有意思的项目,非常适合练手,今天这里我们实现炸金花的底层模拟。 二.游戏规则 1.一副扑克牌去掉大小王,剩下52张牌2.参与游戏的玩家每人发三张牌3.比较每个人手中牌的大小4.若三张牌相同&#xff0…

【工具】vscode的常用插件之注释插件

🐚作者简介:花神庙码农(专注于Linux、WLAN、TCP/IP、Python等技术方向)🐳博客主页:花神庙码农 ,地址:https://blog.csdn.net/qxhgd🌐系列专栏:善假于物&#…

CyberLink的视频编辑软件PowerDirector Ultimate 21.4版本在win10系统的下载与安装配置教程

目录 前言一、PowerDirector Ultimate安装二、使用配置总结 前言 PowerDirector Ultimate是由CyberLink公司开发的一款视频编辑软件,其为高级版本,拥有多种强大的视频编辑和效果功能。该软件具有许多强大的功能和工具,包括多轨时间线编辑、视…

CBLUE_中文生物医学语言理解评估基准_源码详解

CBLUE_中文生物医学语言理解评估基准_源码详解 源码链接:https://github.com/CBLUEbenchmark/CBLUE 项目中包括八个不同的中文医学NLP任务:1.中文医学命名实体识别(CMeEE)、2.中文医学文本实体关系抽取(CMeIE&#xf…

英国 VM600 CPUR2 机架控制器和通信接口卡

英国 VM600 CPUR2 机架控制器和通信接口卡VM600 CPUR2/IOCR2机架控制器和通信接口卡对,支持Modbus TCP和PROFIBUS DP使用以太网连接到运行VM600 MPSx和VibroSight软件的计算机,对VM600机架中的保护卡(MPC4)进行“一次性”配置管理对通过现场总线共享的数…

基于 Python 长时间序列遥感数据处理及在全球变化、物候提取、植被变绿与固碳分析、生物量估算与趋势分析等领域中的应用

植被是陆地生态系统中最重要的组分之一,也是对气候变化最敏感的组分,其在全球变化过程中起着重要作用,能够指示自然环境中的大气、水、土壤等成分的变化,其年际和季节性变化可以作为地球气候变化的重要指标。此外,由于…

【CANN训练营0基础赢满分秘籍】 应用开发深入讲解→端到端案例

1 样例调试 1.1 日志文件 运行应用程序后,若出现报错或异常,需录取日志进一步定位问题。日志文件的默认目录为$HOME/ascend/log。 可通过环境变量指定日志文件的落盘路径 export ASCEND_PROCESS_LOG_PATH/$HOME/xxx但需要确保该目录为任意有读写权限…

文档图像智能分析与处理:CCIG技术论坛的思考与展望

文档图像智能分析与处理:CCIG技术论坛的思考与展望 文档识别与理解的发展趋势视觉-语言预训练模型在文档处理中的应用篡改文本图像的生成与检测的研究进展华为云OCR技术的进展与行业实践智能文档处理技术的应用与挑战文档图像预处理的整体架构弯曲矫正摩尔纹去除版面…

【Linux】普通用户无法使用sudo指令的方法

​ ​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:Linux 🎯长路漫漫浩浩,万事皆有期待 上一篇博客:【Linux】…

计算机视觉的应用6-利用VGG模型做毕加索风格图像迁移

大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用5-利用VGG模型做毕加索风格图像迁移,本文将利用VGG模型实现毕加索风格图像迁移的方法。首先,我们将简要说明图像风格迁移的原理,然后使用PyTorch框架&#xff0c…

chatgpt赋能Python-python_fig

Python中的fig:简介和应用 什么是fig? fig是Python中一个高效且易用的图形库,它支持大量的图像绘制功能,包括2D图形绘制、曲线和图像处理,以及3D图形和动画绘制等应用。fig可以在多个平台上运行,包括Wind…

客户体验|审美体验与体验管理

Guofu 第 93⭐️ 篇原创文章分享 (点击👆🏻上方卡片关注我,加⭐️星标⭐️~) 🚏 写在前面 伽达默尔说:“如果某个东西被经历过,而且它的经历存在还获得一种使自身继续存在意义的特征…

chatgpt赋能Python-python_har

Python HAR:一种高效的网络监测工具 Python HAR(HTTP Archive)是一个用于监测网络资源的强大工具,它能够记录网络请求、响应和资源加载的细节信息,并以可视化和格式化的方式呈现出来。Python HAR的应用范围广泛&#…

单模光纤二维模场分布的MATLAB仿真

在上一篇文章中,我们介绍了单模光纤的一维模场分布,能看出沿着径向的光场分布情况,并分析能量的分布 这一篇中,我们绘制光纤横截面上的二维光场分布:代码如下: clear close all V 2.4000; U 1.6453; W …

C4D R26 渲染学习笔记(1):C4D版本选择和基础知识(更新中)

C4D版本知识 C4D通过R来进行版本区分,现在2023年5月22日最新版的是R26。说一下特殊版本。 C4D版本介绍特点R19OC快乐版3.07最高版本,OC是C4D最具性价比的渲染器,OC学习成本低,渲染速度快,但是注意OC 3.07只支持10系N…

如何提取微信公众号的链接?非常简单!

今天在公众号里面想要复制公众号链接,用于小程序里面引导用户关注,因为小程序里面的关注公众号只能是扫码小程序才能使用,想起以前使用的原始链接跳转方法,就想试一试,结果公众号后台居然没有链接可以复制了&#xff0…

代码随想录算法训练营day49 | 121. 买卖股票的最佳时机,122.买卖股票的最佳时机II

代码随想录算法训练营day49 | 121. 买卖股票的最佳时机,122.买卖股票的最佳时机II 121. 买卖股票的最佳时机解法一:动态规划解法二:贪心算法 122.买卖股票的最佳时机II解法一:动态规划解法二:贪心算法 121. 买卖股票的…