tableau
tableau介绍
tableau可以做数据可视化,但可视化只是tableau的基操,数据赋能和数据探索才是tableau的正确打开方式
数据赋能:让业务一线也可以轻松使用最新数据
数据探索:通过统计分析和数据可视化,从数据发现问题,用数据验证假设
数据连接
本地文件
csv数据连接到文本
xls、xlsx连接到excel
数据库
下载数据库对应的驱动后,填写地址等参数连接到对应的数据库
最后会再次说明
连接方式
默认使用智能连接只需选择连接所用的数据字段即可
连接所用的字段可以通过函数进行计算和编辑
表格之间的连接原理在后续的sql会再次说明
课程中的连接,通过门店和日期进行内连接 因为门店id和日期可以唯一标识
提取方式
实时:每次计算都会连接一次数据库进行取数运算。因为tableau的本质是Vizal查询语言,每做一个操作就查询一次是可以实现的,但在数据量级较大的情况下会比较慢(public好像没有这个功能)
数据提取:
将当前连接所涉及的数据全部都查询提取到hype格式的数据提取(相当于Tableau自己的数据库和对应类型的文件)
如果保存为twbx格式,hyper会自动打包进twbx,是tableau自带数据
缺点是每次修改完数据源都要重新提取一遍数据,如果是实时,则不需要先提取,等你作图时它才会再提取
如果要将tableau上传到sever服务器,则必须使用提取的数据连接方式
其实大量级数据都要用数据提取,除了修改连接建,其他操作在工作表的视图界面都能操作
提取选项:
如果选择数据提取,tableau还支持对表格进行基于字段和函数的增量式刷新,提升数据提取的鑫能,但百万级以下的数据,除非频繁提取,否则一般不需要这样操作
连接筛选
可以在提取数据后进行预筛选,只保留筛选后的数据进行视图操作
保存类型
twb不包含数据
twbx内置数据到tableau的文件中
点提取但是还没有保存时,tableau会让你先保存提取的数据
数据处理
可以查看数据,进行排序,重命名,拆分等操作
这些操作在做图界面也可以完成
数据可视化原理
1.看图比看字快
2.对于可视化来说,数据有维度和度量两种类型
3.度量映射图形,维度负责区分
4.对度量和维度进行拖拽操作,从而完成可视化的图表的操作,是被称为tableau第一概念,是最重要的知识
5.可拖拽的区域主要有以下三个:
行列 行:将字段作为纵轴 列:将字段作为横轴 两者可以通过转置交换
标记卡 用来切换数据对应的视觉映射类型 调整图表颜色,标记,大小等展示细节
筛选器 将指定变量作为筛选条件
实际操作
①将shop表的GMV拖拽至行,形成一个柱子,数值是自动聚合运算的总和(这一列行求和),这是因为tableau会根据视图的详细级别自动对度量进行聚合运算,默认就是总和
②点击标记-自动-右侧的小三角,会有很多图形,你可以进行选择
③tableau可视化原理的第一个概念:度量值会形成图形标记,图形标记可以切换 简单来说,就是任何度量形变量都可以变成一个具体图形,下面是一些例子
④如何形成多个点,让他们连成线呢 引入维度(横坐标)对点进行拆分 我们复制shop表的日期字段修改为字符串格式 拖拽日期(复制)至列 ,原来的单点就被投放日期切分成了多个点,并连成了线,如果想完全显示折线图,可以将视图填充选为适合宽度
这里我假设你经常使用日期并且以天为分隔那么可以这样固定一个变量,点击创建后里面有个自定义日期,点开就行了
结果就是这样