Tableau|三 数据连接与管理

news2025/1/13 7:32:02

一 Tableau的数据架构

数据连接层(Connection)、数据模型层(DataModel)和数据可视化层(VizQL)。

1.数据连接层

决定了如何访问源数据和获取哪些数据。

数据连接层的数据连接信息包括数据库、数据表、数据视图、数据列,以及用于获取数据的表连接和SQL脚本,但是数据连接层不保存任何源数据。
在数据连接层,用户可以方便地对Tableau工作簿的数据连接进行修改,例如,将一系列仪表板的数据连接从测试数据库切换到生产数据库,只需要编辑数据连接,变更连接信息,Tableau会自动处理所有字段的实现细节。

2.Tableau中的数据模型层

关系数据库中的数据可以在Tableau中进行一定程度的数据建模工作,主要内容包括管理字段的数据类型、角色、默认值、别名,以及用户定义的计算字段、集和组等。

例如,如果在数据库中删除字段,那么在Tableau工作表中对应的字段会被自动移除,或者自动映射到别的替代字段。

在完成数据连接后,Tableau会自动判断字段的角色,把字段分为维度字段和度量字段两类。不论数据源来自哪种服务器,Tableau中的数据都会分为维度和度量两大类。如果所连接数据是多维数据源,那么Tableau直接获取数据立方体维度和度量信息;如果连接的是关系数据源,Tableau会根据数据库的数据来判断该字段是维度字段还是度量字段。


要注意的是,由于多维数据源的特性,Tableau引入的多维数据源本身已经是一种聚合的形
式,无法再进行进一步的聚合,并且维度字段将不能随意改变组织形式(如分组、创建分层结构、
角色转换)和参与计算,同时度量字段也不能使用分级和改变角色。 


二 数据连接(数据来自同一张数据表)

1.新建数据源

2.连接文件数据源 

1.连接到电子表格

选择工作表。

如果需要在下次使用时快速打开数据连接,可以将数据连接添加到已保存数据源中。下面操作后点保存即可。

2.连接到Access文件

3.连接到Tableau工作簿

3.连接服务器数据源

1.连接到Oracle 数据库

还可以连接到Oracle Essbase,这是Oracle的多维数据库。与关系数据源不同,当连接到多维数据源时,不能使用SQL或MDX语言进行查询,而在Tableau创建实时可视化查询时会使用优化后的MDX语言进行操作。

2.连接到ODBC

 

3.连接到Cloudera Hadoop

可以选择Hadoop中的表进行实时提取数据。虽然Hadoop不是传统意义上的SQL,但是借助Impala或Hive,也可以通过新自定义SQL来完成数据连接。

Tableau从Hadoop中获得的数据和其他关系型数据源没有任何区别。 

4.复制粘贴输入数据

将数据复制粘贴到Tableau中,Tableau会根据复制数据自动创建数据源。用户可以直接复制的数据包Microsoft Excel和Word在内的Office应用程序数据、网页中HTML格式的表格、用逗号或制表符分隔的文本文件数据。

直接在上面这个界面 ctrl v 即可自动创建。

在临时文件夹中创建了一个以“Clipboard”开头的文本文件,并连接到了该文本数据源。

5.筛选数据

如果仅希望对部分数据进行分析,可以使用数据源筛选器。Tableau可以在新建数据源时选择筛选器,也可以在完成数据连接后,对数据源添加筛选器。

1.在数据连接时应用筛选器

2.针对数据源应用筛选器


 

三 数据整合 (数据来自多张数据表或不同文件,不同服务器)

Tableau的数据整合功能可实现同一数据源的多表联结、多个数据源的数据融合,以及针对源数据的行列转换。

1.实现多表联结

 

如果不希望按照Tableau默认的方式进行表间数据联接,用户可以选择指定表联接方式。

单击“联接”图标,可以看到有4种联接类型,默认选择的是“内部联接。

“内部”只列出与联接条件匹配的数据行;

“左侧”表示不仅包含查询结果集合中符合联接条件的行,而且还包括左表的所有数据行;

“右侧”表示不仅包含查询结果集合中的符合联接条件的行,而且还包括右表的所有数据行;

“完全外部”表示包含查询结果集合中的包含左、右表的所有数据行。

完成表联接后,选择“转到工作表”,可以在工作区数据窗口中看到“台区基本信息”“重过载信息”两张数据表的信息。

2.多数据源的数据融合 

如果台区的基本信息与重过载信息属于不同的数据源,那么通过多表联接的方式将无法实现台区基本信息和重过载信息的关联。这种情况下,需要通过添加数据源的方式实现数据融合。

主数据源是在视图中首先使用的数据源。将“重过载信息”数据源的字段拖放到工作区建立视图后,数据源上的标记变为蓝色,表示是主数据源。

在主数据源之外,再使用其他数据源后,可以看到数据源用橙色标记,表示此数据源是从数据源。

 多维数据源(多维数据集)不能用作从数据源,只能用作主数据源。

 

 

 

 3.行列转换

在使用Tableau进行数据分析时,有时我们需要将源数据中的不同列整合至同一列。

按住Shift或Ctrl,同时选中需要进行转换的列,单击已选择的任一列右侧的下拉菜单按钮,在弹出对话框中选择“数据透视表”。

Tableau自动产生新列“数据透视表字段名称”,原列名称转换为该列的不同字段值,同时自动产生新列“数据透视表字段值”,原列的字段值转换至该列,用户可根据实际业务含义对列名进行修改。

选择评分和评分人数两个字段。

 

4.数据加载

 方法1:实时连接,Tableau从数据源获取查询结果,本身不存储源数据。

方法2:数据提取,将数据提取到Tableau的数据引擎中,由Tableau进行管理。

1.创建数据提取

 方法1:完成数据连接之后,针对数据源进行提取数据操作。

 选择“添加”,弹出添加筛选器对话框,选择用于筛选器的字段。

 

 

采用筛选器提取数据时,数据窗口中的所有隐藏字段将会自动从数据提取中排除。单击“隐藏所有未使用的字段”按钮可快速地将这些字段从数据提取中删除。

 方法2:在新建数据源时选择“提取”方式。

在新建数据源的过程中,将连接方式从“实时”模式更改为“提取”模式。选择“转到工作表”后,将数据以.tde格式保存,即完成了数据提取的创建。

使用数据提取的好处是通过创建一个包含样本数据的数据提取,减少数据量,避免在进行视图设计时长时间等待查询响应,而在视图设计结束后,可以切回到整个数据源。

2.刷新数据提取

当源数据发生改变时,通过刷新数据提取可以保持数据得到更新。

数据提取的刷新包含两种方式:

方式1:完全数据提取。将所有数据替换为基础数据源中的数据。

默认情况下,将对数据提取进行完全刷新。这意味着每次刷新数据提取时,所有行都会替换为基础数据源中的数据。虽然这种刷新可确保数据提取是数据源的精确副本,但执行这种刷新有时需要大量数据库开销。

方式2:增量数据提取。仅添加自上次刷新后新增的行。 

可以将数据提取设置为仅添加自上次提取数据以来新增的行,而不是每次重新生成整个数据提取。

改变数据源的提取方式:

 

 

3.向数据提取添加行

向数据提取文件添加新数据:

添加新数据行的前提是该文件或数据源中的列必须与数据提取中的列相匹配。

方式1:从文件添加。

当要添加的数据的文件类型与数据提取的文件类型相同时,可以选择从文件数据源向数据提取文件添加新数据。

进入从文件添加数据对话框,选择所要添加的数据文件,单击“打开”,Tableau就会完成从文件添加数据的操作,并提示执行结果。

 

方式2:从数据源添加。

从工作簿中的其他数据源向所选数据提取文件添加新数据。

“数据”➤“<数据源名称>”➤“数据提取”➤“从数据源添加数据”。

4.优化数据提取

提高数据提取的查询响应速度。

1.计算字段的预处理

进行数据提取优化后,Tableau提前完成计算字段的预处理,并存储在数据提取文件中。

在视图中进行查询时,Tableau可以直接使用计算结果,不必再次计算。
如果改变了计算字段的公式或者删除了计算字段,Tableau将相应地从数据提取中删除计算字
段。当再次进行数据提取优化时,Tableau将重新进行计算字段的预处理。

 

2.加速视图 

如果在工作簿内设置了筛选器操作,那么Tableau必须基于源工作表的筛选器,以此计算目标视图的筛选器取值范围。

进行数据提取优化后,Tableau将创建一个视图以计算可能的筛选值并缓存这些值,从而提高查询速度。

5.数据维护

新建数据源是用户进行数据准备的第一步,在后续工作中,用户需要通过直接查看数据,验证数据连接是否成功;通过添加数据源筛选器,限定分析的数据范围;通过刷新数据源操作,保持分析的数据更新。

1.查看数据源的数据

 在查看数据界面,用户可以选择将数据复制到粘贴板。

2.刷新数据 

当数据源中的数据发生变化后(包括添加新字段或行、更改数据值或字段名称、删除数据或字段),需要重新执行新建数据源操作,才能反映这些修改;另外,也可以执行刷新操作,在不
断开连接的情况下即时更新数据。

如果工作簿中视图所使用的数据源字段被移除,那么完成刷新数据操作后,将显示一条警告消息,说明该字段将从视图中移除。由于缺少该字段,工作表中使用该字段的视图将无法正确显示。 

3.替换数据

希望使用新的数据源来替换已有的数据,而不希望新建工作簿。

完成数据源替换后,当前工作表的主数据源变更为新数据源。

4.删除数据

使用了新数据源后,可以关闭原有数据源连接。

执行关闭数据源操作后,被关闭数据源将从数据源窗口中移除,所有使用了被删除数据源的工作表也将被一同删除。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2199445.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

华为大咖说 | 新时代,智能电动车车联网有哪些发展趋势?(下篇)

本文作者&#xff1a;朱行健&#xff08;华为专家&#xff09;全文约4252字&#xff0c;阅读约需9分钟 近年来&#xff0c;汽车产业逐步向电动化、自动化、网联化、共享化发展&#xff0c;车联网开始成为新的竞争主体&#xff0c;汽车市场开始出现新的市场发展驱动力、形成新的…

E36.C语言模拟试卷1第一大题选题解析与提示(未完)

点我去下载C语言模拟试卷1的文件 备注:ZIP文件中的参考答案仅仅提供最终结果 目录 第3题 第5题 第7题 第9题 第14题 第16题 第19题 第20题 第22题 第24题 第26题 第27题 第28题 第3题 3.若有说明语句&#xff1a;char c ‘\64’ ; 则变量C包含&#xff1a; …

python19_加减乘除(二)

加减乘除 a hello b world c 2 d 4# 字符串加法 def str_add(A, B):result A Breturn result# 字符串乘法 def str_mul(A, B):result A * Breturn result# 字符串除法 def str_div(A, B):result B / Areturn result# 字符串减法 def str_sub(A, B):result B - Aretur…

A股牛市来袭,资本涌动:加密市场的出路与机遇

近期&#xff0c;随着A股的强劲反弹&#xff0c;不少加密市场的投资者&#xff0c;尤其是一些KOL&#xff08;关键意见领袖&#xff09;&#xff0c;开始转移资金并公开建议进军A股。这种趋势反映出部分投资者对加密市场的信心动摇&#xff0c;尤其是在全球宏观经济不确定性加剧…

python兴农购物网站系统—计算机毕业设计源码38256

摘 要 助农工作是当前我国全面建成小康社会的重点工作&#xff0c;由于我国农村地域广大&#xff0c;贫困人口多&#xff0c;区域差异大&#xff0c;因此&#xff0c;不同区域的扶贫方法也是不一样的。近年来&#xff0c;随着网络的普及。许多农村地区物产丰富&#xff0c;但由…

【解决方案】基于数据库驱动的自定义 TypeHandler 处理器

前言 笔者在最近的项目开发中&#xff0c;频繁地遇到了 Java 类型与 JDBC 类型之间的2个转换问题&#xff1a; 数据库的 varchar 类型字段&#xff0c;需要存储 Java 实体中的 JSON 字符串 数据库的 int 类型字段&#xff0c;需要存储 Java 实体中的 Enum 枚举 其实要处理也不…

数据库软题6.2-关系模式-范式

一、判断部分函数依赖&#xff08;1NF有部分函数依赖&#xff09; 题型&#xff1a;给出函数依赖集和属性&#xff0c;判断该关系模式属于第几范式。 求出候选码 若是候选码为属性的组合&#xff0c;则可能有部分函数依赖&#xff1b;&#xff08;存在部分函数依赖&#xff0…

苹果AI重磅升级!ChatGPT正式登陆iPhone,开启智能生活新时代

苹果AI重磅升级&#xff01;ChatGPT正式登陆iPhone&#xff0c;开启智能生活新时代 在今年的全球开发者大会&#xff08;WWDC 2024&#xff09;上&#xff0c;苹果公司引爆了科技圈——通过与OpenAI合作&#xff0c;苹果宣布将人工智能技术与iPhone深度融合。通过这个合作&…

自由学习记录(2)

Unity打包图集相关 Draw Call 实验设置&#xff1a; 我们将创建两个场景&#xff0c;一个场景有高 Draw Call&#xff0c;另一个场景通过优化减少 Draw Call。然后对比它们的帧率&#xff08;FPS&#xff09;。 场景 1&#xff1a;高 Draw Call 场景&#xff08;无优化&…

浙大数据结构:07-图5 Saving James Bond - Hard Version

这道题也是很有难度&#xff0c;我最开始尝试用Dijkstra来做&#xff0c;发现不是很好处理&#xff0c;用bfs还不错。 机翻&#xff1a; 1、条件准备 n为鳄鱼数量&#xff0c;jump为跳跃距离&#xff0c;headjump为第一次跳跃距离&#xff0c;包括了岛的半径。 isalive标识…

求职书与求职经历 - Chap01.

节前定点在智联投了几家&#xff0c;智联上之前的简历还在&#xff0c;稍稍维护了一下&#xff0c;现在有两三家再看看。然后节后&#xff0c;今天&#xff0c;注册了职友网的7天会员。正在整理简历。 专利证书&#xff0c;通过soopat查&#xff0c;很不友好。国家产权局后来直…

docker部署langfuse 本地

下载langfuse地址:https://api.github.com/repos/langfuse/langfuse/tarball/v2.43.2 tips&#xff1a;这里有的博主说需要clone到本地&#xff0c;但是我的docker clone langfuse到本地使用docker安装页面提示如下错误: 最后使用下载地址 上传到服务器后 解压再安装 反正没有…

PIFA天线工作原理:【图文讲解】

1&#xff1a;什么是PIFA天线 PIFA ( Planar Inverted F-shaped Antenna)天线即平面倒F形天线&#xff0c;因为整个天线的形状像个倒写的英文字母F而得名 2&#xff1a;PIFA天线的应用 PIFA常见于手机天线设计&#xff0c;占手机内置天线的60%-80% 3&#xff1a;PIFA天线结构…

5.错误处理在存储过程中的重要性(5/10)

错误处理在存储过程中的重要性 引言 在数据库编程中&#xff0c;存储过程是一种重要的组件&#xff0c;它允许用户将一系列SQL语句封装成一个单元&#xff0c;以便重用和简化数据库操作。然而&#xff0c;像任何编程任务一样&#xff0c;存储过程中的代码可能会遇到错误或异常…

封装vue-cropper,图片裁剪组件

组件基本使用: 这里的action同时也可以传相对路径&#xff0c;比如封装了axios&#xff0c;那么组件源码里就不需要引入原生axios&#xff0c;可以替换为封装的axios。传 action"/upload/file" 源代码&#xff1a; <script setup> import WuyuCropper from /c…

PyTorch单机多卡训练(无废话)

目前大家基本都在使用DistributedDataParallel&#xff08;简称DDP&#xff09;用来训练&#xff0c;该方法主要用于分布式训练&#xff0c;但也可以用在单机多卡。 第一步&#xff1a;初始化分布式环境&#xff0c;主要用来帮助进程间通信 torch.distributed.init_process_g…

Notepad-- 程序员日常用法

一、快速查找标记&#xff0c;提取指定的字符串 1.使用正则表达式查找并标记&#xff0c;将标记的内容复制到新文本中 标记中输入&#xff1a;.*"staffNo": "([^"])".* 这个正则表达式可以匹配整个行&#xff0c;并将 staffNo 后面的内容标记出来。…

修复WordPress .htaccess文件中的常见问题

在搭建WordPress网站时&#xff0c;.htaccess文件非常重要。它可以帮助我们管理网站的重定向、优化URL结构、提高网站安全性等。然而&#xff0c;有时可能会出现由.htaccess文件引起的问题&#xff0c;比如500内部服务器错误、重定向次数过多和文章返回404错误等。本文将详细介…

Hadoop---概念篇

一、Hadoop的组成 二、HDFS架构概述 **1.NameNode(nn): **存储文件的元数据,例如:文件名、文件目录结构、文件属性(生成时间、副本数、文件权限)以及每个文件的块列表和块所在的DateNode等。 **2.DateNode(dn): **在本地文件系统中存储的文件块数据,以及块数据的校验和。 **3.…

后端必备技巧之SQL优化

日常开发中&#xff0c;几乎都免不了和数据库打交道&#xff0c;说到数据库&#xff0c;我们也需要联想这几个问题&#xff1a;我们写的SQL性能怎么样&#xff1f;有没有优化的空间&#xff1f;如何优化&#xff1f;下面我们来介绍关于SQL性能的命令EXPLAIN 什么是EXPLAIN命令&…