【云计算 复习】第5节 交互式分析工具Dremel(含大题)

news2024/11/18 13:51:08

一、概念

1.概述

(1)数据本身不会产生价值 只有经过分析才有可能产生价值。

(2)Google的Dremel是第一个在嵌套数据模型基础上实现列存储的系统

(3)列存储有其便利之处,因为在不同列中相同位置的数据必然属于原数据库中的同一行。

(4)Dremel和MapReduce并不是互相替代,而是相互补充的技术。在不同的应用场景下各有其用武之地。

2.用户希望提交完请求后,在一个相对可接受的合理时间内收到返回结果,mapreduce批处理效率太低。

MapReduce   ←→    Hadoop

Dremel       ←→    Apache Drill

3.两方面的技术支撑

(1)统一的存储平台实现高效的数据存储,Dremel使用的底层数据存 储平台是GFS

(2)统一的数据存储格式

4.数据结构的无损表示(重点)

首先明确标题头,那个一定精确到最末项,如Name.Language.Code。这里成name是首项,后面依次是二项,三项,除此之外最后那个项称它叫末项。

还有就是空值也要进行判断r和d,值那一栏要写null。

(1)重复深度r:姑且可以称为第几次出现,但是只有在不同表的第一次出现该末项时是0,出现之后在该表,如果不是同一个项的下个项,例如Url,不是同一个name,这统一都是1,要明确这个不是出现了几次的意思,但是如language.code,同时出现在那么这个二项下,那第二个的code就要写2了,再次注意这个数字不是出现了几次,或者说第几个出现的意思,你可以把他当做一种极致简单的代指,说这是一条狗,那是一只猫这样的。

(2)定义深度d:如果只有一项,就是1。如果有两项,如name.url就是2,如果有三项,如name.language.country,就是3.但是

如果这只是最大值,如name.url,第一张表的第三个name,没有存在url项,则此时视作为1,此时可以认为只有name这一项。

同时为什么name.language.code不是3而是2,请注意右上角的代码上写的code和docid是required,即类似key值的意思。所以不计入。所以docid都是0,也就是可重复度为0。code同理。

5.数据重组(重点)

(1)就是让上面的表2变成表1。

(2)核心思想是为每个字段创建一个有限状态机(FSM)。

(3)从一个方框到一个方框上的数是r,自循环上是d,

依次出现几个repeated就是几,例如name.url,虽然Name本身是,但是url只是个optional,所以自循环是0,不用写,但是links.backword,link是optional,但是backward这个末项是repeated,所以自循环是1,同理links.forward上应该也是1,但是没打印上。

这种一定要看清末项是不是repeated,不然容易乌龙。

(4)剩下的就是按下方图二中的顺序从上到下,画出图一中的线,写上数即可,像其中的0,1,2那里你画三条线才是最正确的,但是这里图省事画一起了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1857032.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

windows-docker-本地部署-前端

前置条件 docker已有需要打包的文件也已经写好了 打包镜像 ip地址修改 需要根据自身修改的文件 .env.local文件存放你前端访问的端口 172.24.240.1:这部分是自己电脑的ip 如何查看本机ip,使用IPV4的地址。 #本地 #API_HOST_URLhttp://172.24.240.1:8091打包文…

在线装修管理系统的设计

管理员账户功能包括:系统首页,个人中心,管理员管理,装修队管理,用户管理,装修管理,基础数据管理,论坛管理 前台账户功能包括:系统首页,个人中心,…

C语言中操作符详解(二)

OK,今天继续为诸君带来有关C语言中操作符的讲解 一 . 位操作符 C语言中的位操作符我相信大家并不陌生,我们在之前就已经接触过了一些 位操作符(位操作符的操作数只能是整数): (1)& &…

中国能源统计年鉴(1986-2023年)

数据年份:1986-2023年,无1987、1988、1990三年,1991-2023年齐 数据格式:pdf、excel 数据内容:《中国能源统计年鉴》是一部反映中国能源建设、生产、消费、供需平衡的权威性资料书。 共分为7个篇章:1.综合&a…

自动预约申购 i茅台工具完善

自动预约申购茅台工具 概述新的改变界面预览 概述 今天刷到一个windows自动刷茅台的工具,是用wpf实现的,看到作者最后是2023年更新的,评论中有好多人提出一些需求,刚才在学习wpf,就试着完善了一下。 工具下载&#x…

Spring AI 整合openAI的chatGpt

Spring AI支持ChatGPT,这是OpenAI的AI语言模型。ChatGPT在激发人们对人工智能驱动文本生成的兴趣方面发挥了重要作用。 SpringAi与Spring Boot 的整合详见上一篇文章: Spring AI 介绍以及与 Spring Boot 项目整合 下面分四个部分来分别说明和演示&#…

hive优化之逻辑类似or逻辑重复

今天拿到一个二次开发的需求,只是增加一个业务类型,开发起来倒是也蛮轻松。 但是,对自己的要求不难这么低,否则可替代性也太高了。 除了完成自己的那部分开发,当然展现自己实力的,可以是优化。 1&#x…

【Altium】查找PCB上未连接的网络

【更多软件使用问题请点击亿道电子官方网站】 1、文档目标: PCB设计后期检查中找出没有连接的网络 应用场景:PCB设计后期,需要检查是否所有网络都已连接布线。虽然未连接的网络会有飞线显示,但是由于布线后期整板布线密度较高&…

Spring Bean自动装配:深入解析与实战应用

何为自动装配 在使用Spring框架配置bean时,我们通常需要为bean的属性设置值。如果不手动设置这些值,它们通常会被初始化为默认值(对于对象类型通常是null,对于基本类型如int则是0,boolean是false等)。自动…

使用js实现excel的读取展示以及导出

代码 <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title><link rel"st…

Unity如何保存玩家的数据(Unity的二进制序列化)

文章目录 什么是二进制序列化读写文件构造函数 自定义二进制序列化 什么是二进制序列化 Unity中的二进制序列化是一种将游戏对象或数据结构转换为二进制格式的过程&#xff0c;以便于存储或网络传输。这使数据能够以高效的方式保存&#xff0c;同时在需要时可以被正确地恢复&a…

傅佩荣讲座视频全集百度网盘,傅佩荣讲座视频大全百度云

在当今信息爆炸的时代&#xff0c;获取知识的途径日益多元化&#xff0c;其中&#xff0c;通过网络观看各类教学视频已成为众多学习者的首选。傅佩荣教授的视频课程深受广大学者的喜爱。然而&#xff0c;对于许多初学者来说&#xff0c;如何下载傅佩荣的视频却是一个难题。本文…

Flutter 面试八股之深入理解 Dart 异步实现机制

为什么写这一篇内容&#xff1f;因为在此之前关于 《面试题里有意思的异步问题》 的文章收到一些「问题」&#xff0c;但是解释这些「问题」并不是“三言两语”就可以说清&#xff0c;所以干脆做一篇完整解析&#xff0c;相信本篇可以帮助你从头到尾理清 Flutter 里 Dart 的完整…

创新、引领、发展——SAMPE中国2024年会在京盛大开幕

绿树阴浓夏日长&#xff0c;在这个色彩缤纷的季节&#xff0c;SAMPE中国2024年会暨第十九届国际先进复合材料制品原材料、工装及工程应用展览会在中国国际展览中心&#xff08;北京朝阳馆&#xff09;隆重开幕。新老朋友共聚一堂&#xff0c;把酒话桑麻。 为期4天的国际学术会…

公共筛选组件(二次封装antd)支持代码提示

如果项目是基于antd组件库为基础搭建&#xff0c;可使用此公共筛选组件 使用到的库 npm i antd npm i lodash-es npm i types/lodash-es -D/components/CommonSearch index.tsx import React from react; import { Button, Card, Form } from antd; import styles from ./…

LED显示屏的换帧频率与刷新频率:技术细节与市场发展

在当今数字化时代&#xff0c;LED显示屏已成为信息传递和广告宣传的重要工具。然而&#xff0c;对于普通消费者来说&#xff0c;LED显示屏背后的技术细节可能仍然是一个谜。今天&#xff0c;我们将深入探讨LED显示屏中的两个关键概念&#xff1a;换帧频率和刷新频率&#xff0c…

ARM功耗管理软件之WFIWFE

安全之安全(security)博客目录导读 思考&#xff1a;功耗管理软件栈及示例&#xff1f;WFI&WFE&#xff1f;时钟&电源树&#xff1f;DVFS&AVS&#xff1f; ARM功耗管理精讲与实战汇总参见&#xff1a;Arm功耗管理精讲与实战

PS系统教程26

PS与BR的关系 如何把图片以图层的方式导入画板里面 选中三张图片/多张选择工具-PS-将文件载入PS图层意味着这三张图片以图层的方式嵌入PS中 拼接长图 裁剪图片 保存裁剪后的图片拼接图片选中要拼接的图片选择工具-PS-Photomerge(拼合图像&#xff09; 图像处理器 大白话&…

APM教程-SkyWalking安装和配置

SkyWalking简介 APM (Application Performance Management) 即应用性能管理&#xff0c;属于IT运维管理&#xff08;ITOM)范畴。主要是针对企业 关键业务的IT应用性能和用户体验的监测、优化&#xff0c;提高企业IT应用的可靠性和质量&#xff0c;保证用户得到良好的服务&#…

IDEA中 pom.xml 设置自动提示

IDEA中 pom.xml 自动提示 IDEA中 pom.xml 自动提示设置如下&#xff1a; file–>Settings–>Build,Execution…–>Build Tools–>Maven–>Repositories 会看到类似表格的画面&#xff0c;内容是你的maven地址&#xff0c;选中后&#xff0c;右边有个Update的按…