数据分析学习

news2024/11/17 12:58:45

tableau

tableau介绍

tableau可以做数据可视化,但可视化只是tableau的基操,数据赋能和数据探索才是tableau的正确打开方式
数据赋能:让业务一线也可以轻松使用最新数据
数据探索:通过统计分析和数据可视化,从数据发现问题,用数据验证假设

数据连接

本地文件

csv数据连接到文本
xls、xlsx连接到excel

数据库

下载数据库对应的驱动后,填写地址等参数连接到对应的数据库
最后会再次说明

连接方式

默认使用智能连接只需选择连接所用的数据字段即可
连接所用的字段可以通过函数进行计算和编辑
表格之间的连接原理在后续的sql会再次说明
课程中的连接,通过门店和日期进行内连接 因为门店id和日期可以唯一标识
在这里插入图片描述

提取方式

实时:每次计算都会连接一次数据库进行取数运算。因为tableau的本质是Vizal查询语言,每做一个操作就查询一次是可以实现的,但在数据量级较大的情况下会比较慢(public好像没有这个功能)

数据提取:
将当前连接所涉及的数据全部都查询提取到hype格式的数据提取(相当于Tableau自己的数据库和对应类型的文件)
如果保存为twbx格式,hyper会自动打包进twbx,是tableau自带数据
缺点是每次修改完数据源都要重新提取一遍数据,如果是实时,则不需要先提取,等你作图时它才会再提取
如果要将tableau上传到sever服务器,则必须使用提取的数据连接方式
其实大量级数据都要用数据提取,除了修改连接建,其他操作在工作表的视图界面都能操作
提取选项:
如果选择数据提取,tableau还支持对表格进行基于字段和函数的增量式刷新,提升数据提取的鑫能,但百万级以下的数据,除非频繁提取,否则一般不需要这样操作

连接筛选

可以在提取数据后进行预筛选,只保留筛选后的数据进行视图操作

保存类型

twb不包含数据
twbx内置数据到tableau的文件中
点提取但是还没有保存时,tableau会让你先保存提取的数据

数据处理

可以查看数据,进行排序,重命名,拆分等操作
这些操作在做图界面也可以完成

数据可视化原理

1.看图比看字快
2.对于可视化来说,数据有维度和度量两种类型
3.度量映射图形,维度负责区分
4.对度量和维度进行拖拽操作,从而完成可视化的图表的操作,是被称为tableau第一概念,是最重要的知识
5.可拖拽的区域主要有以下三个:
行列 行:将字段作为纵轴 列:将字段作为横轴 两者可以通过转置交换
在这里插入图片描述
标记卡 用来切换数据对应的视觉映射类型 调整图表颜色,标记,大小等展示细节
在这里插入图片描述
筛选器 将指定变量作为筛选条件
在这里插入图片描述

实际操作

①将shop表的GMV拖拽至行,形成一个柱子,数值是自动聚合运算的总和(这一列行求和),这是因为tableau会根据视图的详细级别自动对度量进行聚合运算,默认就是总和
在这里插入图片描述
②点击标记-自动-右侧的小三角,会有很多图形,你可以进行选择

在这里插入图片描述
③tableau可视化原理的第一个概念:度量值会形成图形标记,图形标记可以切换 简单来说,就是任何度量形变量都可以变成一个具体图形,下面是一些例子
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
④如何形成多个点,让他们连成线呢 引入维度(横坐标)对点进行拆分 我们复制shop表的日期字段修改为字符串格式 拖拽日期(复制)至列 ,原来的单点就被投放日期切分成了多个点,并连成了线,如果想完全显示折线图,可以将视图填充选为适合宽度
这里我假设你经常使用日期并且以天为分隔那么可以这样固定一个变量,点击创建后里面有个自定义日期,点开就行了
在这里插入图片描述
结果就是这样
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/570142.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从应用层到MCU,看Windows处理键盘输入 [2.a.1.传球手User32.dll]

副标题:精准型消息断点 引言1. 前文作为系列的开篇,我们站在Notepad.exe的视角,看它接过系统传来的消息,交由Notepad的窗口处理函数(WndProc)进行处理的过程。User32.dll!DispatchMessage API是前面"系统传来"4个字中的一环&#…

Kerberos认证原理及相关漏洞

Kerberos认证协议 Kerberos认证协议也称三头犬协议,因为在Kerberos认证过程中,需要有三个角色:Client、Server以及KDC(Key Distribution Center)密钥分发中心。 Kerberos认证协议的目的是为客户端/服务端提供身份验证。最主要的问题是如何证明…

Win11硬盘分区

电脑重装了Win11系统,按WinE打开主文件夹,再点击此电脑,发现: 磁盘只有一个C盘。硬盘的所有空间都在该盘上了,那么我们怎么将其分区呢? Win11硬盘分区步骤: 步骤1: 按WinR输入dis…

数据库中的事务,隔离级别,以及数据展示

想要知道和学习数据库中的锁,要先学习数据库的事务和并发事务所带来的问题! 1.数据库中的事务! 1.1什么事务 事务是由一组SQL语句组成的逻辑处理单元(多个sql进行修改,新增等),这些操作要么同时…

跟踪任何目标(想跟踪什么就跟踪什么)

结果展示 介绍 该项目是一个简单的跟踪工具,可以用于跟踪任何你感兴趣的东西。它提供了一个基于Web的界面,让用户可以轻松地创建和管理跟踪列表,同时也提供了一个RESTful API,可以方便地进行数据交互。 项目的原理是将用户需要跟踪的内容,通过创建跟踪项的方式存储到数据…

Hausdorff 距离

1. 定义 给定欧氏空间中的两点集 A { a 1 , a 2 , . . . } \rm A\left \{a_1, a_2,... \right\} A{a1​,a2​,...} 和 B { b 1 , b 2 , . . . } \rm B\left \{b_1, b_2,... \right\} B{b1​,b2​,...} , H a u s d o r f f {\rm Hausdorff} Hausdorff 距离就是用…

基于SSM的在线考试系统开发与设计-(附源码文档)-毕业设计

文章目录 1.适用人群2.你将收获3.项目介绍4.系统需求分析4.1 需求特性分析4.2 功能需求分析 5.系统设计5.1 系统总体结构设计5.2 数据库设计5.2.1 数据库概念原则设计5.2.2 数据库各部分模块设计5.2.3 数据库表设计 6.系统详细设计6.1 系统各模块功能设计6.1.1 登录模块6.1.2 注…

chatgpt赋能python:如何利用Python加快计算速度

如何利用Python加快计算速度 在大数据时代,计算效率的问题成为了企业和科研机构普遍关注的焦点问题。Python是一种高级编程语言,其具有灵活、易学、语法简洁、运行速度快等优点,因此在数据分析和科学计算领域广泛应用。然而,Pyth…

chatgpt赋能python:Python内部函数介绍

Python内部函数介绍 Python是一门功能强大、易于学习的编程语言,拥有许多内部函数可供使用。本文将介绍Python的内部函数和其用途,以便更好地利用和理解Python。 什么是内部函数? 内部函数是Python提供的一组内置函数,它们可以…

2023/5/25总结

学习CSS list-style:none 去掉无序列表的带有的样式,比如原点。 border-radius:length 设置圆角,也可以写%,不一定需要些半径大小,也可以顺时针写半径大小,就会出现四个顶点不一样的圆角。或者写:borde…

chatgpt赋能python:Python写Log的技巧与最佳实践

Python 写 Log 的技巧与最佳实践 在编写 Python 应用程序时,日志记录(Logging)是一项非常重要的功能,尤其是在调试或部署过程中。本文将介绍一些 Python 写 Log 的技巧和最佳实践,以帮助你更好地处理日志记录并提高应…

Java的String(字符串详解)

字符串 1.字符串的常见构造方法 主要有三种,一种是直接使用常量去构造,要么使用new String来构造,或者还可以使用字符数组的形式。 public static void main(String[] args) { // 使用常量串构造 String s1 "hello"; System.ou…

order by排序语句的用法

文章目录 学习连接语法用法示例1、按单个列的值排序2、按多个列的值排序3、按指定的规则排序4、按中文拼音字母顺序5、Order by和where条件共用 数据库中常用order by关键字对结果集进行排序,又可使用desc和asc来进行指定规则的排序。 学习连接 数据库:…

chatgpt赋能python:单行for循环:Python编程的神器

单行for循环:Python编程的神器 Python是一门功能强大的编程语言,其中的单行for循环功能更是让它的编程效率倍增。在本文中,我们将探讨单行for循环是如何提升编程效率的。 什么是单行for循环 单行for循环是一种简单而强大的编程方式。它可以…

【利用AI让知识体系化】V8引擎相关知识

文章目录 I. 引言V8引擎的背景和概述 II. V8的设计和工作原理V8的整体设计V8的工作流程和运行机制V8在浏览器中的应用场景 III. 内存管理内存模型和内存管理策略垃圾回收机制和算法内存泄漏和内存优化 IV. JIT编译器JIT编译器的作用和优势V8的编译流程和编译器类型编译器优化技…

make的路径搜索

文章目录 前言一、VPATH二、vpath三、vpath 与 VPATH 的差别四、GPATH 用法总结 前言 在大型软件项目中,通常会存在多个目录,包含有源代码、头文件、库文件等不同类型的文件。在编译或链接时,需要指定相应的文件路径才能正确地进行构建。但是…

【计算机图形学】曲线和曲面(Bezier曲线 Bezier曲面)

模块5 曲线和曲面 一 实验目的 编写曲线和曲面的算法 二 实验内容 1:绘制Bezier曲线,并采用自行设计输入和交互修改数据点的方式。 实验结果如下图所示: 第一步:输入特征多边形的顶点个数,并按照顺序输入顶点的坐…

css3新增特性

1. 初始化 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthdevice-width, …

怎么通过ecs云服务器来给小程序发送消息

如果您想通过 ECS 云服务器向小程序发送消息&#xff0c;可以使用 WebSocket 技术。具体步骤如下&#xff1a; 1. 在 ECS 云服务器上搭建 WebSocket 服务器。您可以使用 Node.js、Java、Python 等编程语言来实现 WebSocket 服务器&#xff0c;具体实现方式可参考相关技术文档或…

Java笔记——KMP算法

KMP算法 文章目录 KMP算法KMP算法介绍主要逻辑Next数组KMP搜索代码解释生成next数组模式串匹配 源码展示 KMP算法介绍 KMP算法是一种串的模式匹配算法&#xff0c;用来求子串在主串的位置。是数据结构中比较难的一种算法。KMP算法的核心在于点在于如何利用子串生成next数组&am…