大数据技术复习--概述

news2024/11/15 11:35:41

概述

数据的概念:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合,是可识别的、抽象的符号。

数据类型:文本、图片、音频、视频

从数据的结构化程度来看可以分为:

  • 结构化数据
  • 半结构化数据
  • 非结构化数据

在这里插入图片描述
数据生命周期:创建、发布利用、修改、归档/销毁
数据的使用:1. 数据清洗、2.数据管理、3. 数据分析

在这里插入图片描述

OLTP:联机事物处理,高并发且数据量级不大的查询,是主要用于管理事物的系统
OLAP:联机事物分析处理,是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果
ETL:抽取、转换、加载,是数据获取的重要手段,需要知道具体格式
ELT:ETL的时间成本和吞吐量限制(堵塞),导致ETL这种数据加工的方式不能满足于现在的企业发展需要
把Transform(转换)和Load(加载)拆开,这样处理数据的部分就专心计算就行了,搬运数据的部分就专心搬运

大数据定义

大数据是到无法通过现有手段在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息

V描述
Volume规模大,达到难以处理
Variety类型多,多到难以处理
Velocity速度快,快到难以处理
Value有价值,价值密度稀疏
Veracity真实性,数据质量有保障

科学研究的四范式

  1. 实验
  2. 理论
  3. 计算
  4. 数据

大数据技术属性

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1981293.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024华数杯全国大学生数学建模竞赛B题思路-VLSI电路单元的自动布局-MIA 感知的详细布局问题描述

本章主要对超大规模集成电路(Very Large Scale Integration Circuit,VLSI)布局 问题进行了描述,首先简单梳理一下超大规模集成电路设计流程、物理设计相关的知 识,接着对 MIA 感知的混合高度单元集成电路详细布局问题的…

vue之ref 属性

文章目录 1.ref 属性概述1.1 作用和特点 2.vue2用法2.1 获取 dom2.3 获取组件: 3.vue3用法 1.ref 属性概述 1.1 作用和特点 (1)作用:用来给元素或组件注册引用信息(相当于是id的替代者) (2)应用在HTML标签…

Kettle下载安装MySQL驱动教程

在 Windows 系统上下载适用于 MySQL 的 JDBC 驱动程序,您可以按照以下步骤操作: 1. 访问 MySQL 官方下载页面 打开浏览器: 打开您喜欢的浏览器。 访问 MySQL Connector/J 下载页面: 访问 MySQL Connector/J 下载页面. 2. 选择…

探索亚马逊Amazon S3:无缝存储管理与极速数据传输的奥秘

亚马逊云科技中Amazon S3,因其设计简单与高度可靠,允许用户通过互联网存储和检索任意数量的数据,并能够自动扩展以满足各种规模的需求,使得Amazon S3成为了许多云计算应用和网站的核心存储基础设施之一,Amazon S3提供的…

WSL2安装多个Ubuntu实例,大佬带你玩转Linux!!!

安装wsl子系统并安装一个Ubuntuwsl ubuntu 安装的正确方式-CSDN博客文章浏览阅读546次,点赞10次,收藏4次。wsl ubuntu 安装的正确方式:将wsl2设置为默认版本:1、打开powershell2、设置wsl的版本为2​编辑3、更新wsl程序4、强制关闭子系统5、查看wsl支持的列表6、安装指定版…

【Dynamo】AnyCAD使用Dynamo绘制三维模型(二)——生成序列和范围的几种方式

说明: Dynamo为开源项目,开源地址:https://github.com/DynamoDS/Dynamo.git本文章使用版本:v3.0.3 范围 使用Range节点 start和end分别表示范围的边界,step表示步长。如下为[1,10]范围内步长为2结果 ​ 使用Code…

[000-01-025].第07节:WorkBench

我的后端学习大纲 我的Drools学习大纲 8. WorkBench 8.1 WorkBench简介: 1.WorkBench是KIE组件中的元素,也称为KIE-WB,是Drools-WB与JBPM-WB的结合体。它是一个可视化的规则编辑器。WorkBench其实就是一个war包,安装到tomcat中就可以运行。…

UE Sequence学习

UE4中的动画编辑器 —— Sequencer in UE4 - 知乎 (zhihu.com) UE4 LevelSequence源码解析 - 知乎 (zhihu.com) C模块 对ue4 sequence的学习和理解 - 知乎 (zhihu.com) 必须要先在你项目工程的.build.cs里加入 MoviePlayer, LevelSequence, MovieScene. 引入头文件 #inclu…

我所理解的sprd-camera摄像头框架流程分析

摄像头的图像格式:RGB24,RGB565,RGB444,YUV4:2:2 RGB24 表示R、G、B ,3种基色都用8个二进制位表示,那么红色、绿色、蓝色各有256种,那么由这三种基色构成的颜色就是256X256X256=16,777,216种,约等于1677万。UV 和我们熟知的 RGB 类似,是一种颜色编码格式。 YUV 包含三…

sonatype私服配置与下载

文章目录 私服下载地址setting.xml配置java中pom.xml配置上传 私服 下载地址 地址:https://help.sonatype.com/en/download.html 百度网盘地址链接: https://pan.baidu.com/s/1_sjjHbXs27ya49SEcN9XNw 提取码: g56i 1.下载后解压得到两个文件 2.进入到nexus-3.…

揭秘脑囊肿:了解那些不容忽视的症状

脑囊肿,作为颅内的一种良性占位性病变,虽然不常见,但其潜在的症状却可能对患者的生活质量产生显著影响。了解脑囊肿的症状,对于及时诊断和治疗至关重要。 头痛:脑囊肿最常见的症状之一是头痛,这通常是由于囊…

【海贼王航海日志:前端技术探索】CSS你了解多少?(一)

目录 1 -> CSS是什么 2 -> 基本语法规范 3 -> 引入方式 3.1 -> 内部样式表 3.2 -> 行内样式表 3.3 -> 外部样式 4 -> 代码风格 4.1 -> 样式格式 5 -> 选择器 5.1 -> 选择器的功能 5.2 -> 选择器的种类 5.3 -> 基础选择器 5.3…

SQL进阶技巧:数据预处理如何对数据进行分桶【分箱】?

目录 0 引言 1 数据准备 2 数据分桶SQL实现 2 1.基于规则的分桶 2.2 等距分桶 2.3等频分桶 3 小结 0 引言 数据分桶(Bucket)作为数据预处理的一部分,是进行数据模型建设的前提,是构建特征工程的重要手段。也被称为离散分箱或…

【算法】KMP算法

应用场景 有一个字符串 str1 "BBA ABCA ABCDAB ABCDABD",和一个子串 str2 "ABCDABD"现在要判断 str1 是否含有 str2,如果含有,就返回第一次出现的位置,如果不含有,则返回 -1 我们很容易想到暴力…

The Llama 3 Herd of Models 第8部分语音实验部分全文

第1,2,3部分,介绍、概览、预训练 第4部分,后训练 第5部分,结果 第6部分,推理 第7部分,视觉实验 8 Speech Experiments 我们进行了实验来研究将语音功能集成到Llama 3中的组合方法,类似于我们用于视觉识别的方法。在输入端,一个编码器,连同一个适配器,被并入处理语…

低代码开发是什么意思?低代码是开发的未来吗?

在数字化转型的浪潮中,低代码平台是一股不可忽视的力量,它正在以前所未有的速度改变着软件开发的格局。低代码不仅极大地简化了开发流程,降低了技术门槛,还通过高效、灵活的特性,为企业和开发者带来了前所未有的创新机…

页面弹窗中英文切换

一、遇到的问题 页面右上角弹窗如下 二、解决 去掉 lang"en"即可。

SVPWM5段式7段式差异分析和关键代码基于TI F28035

SVPWM5段式7段式差异分析和关键代码基于TI F28035 5段式有一相占空比始终为0或者1 扇区判断的扇区号和实际扇区不是一一对应,直接使用,而是映射关系 扇区判断变量 7段式和5段式在基本矢量作用顺序上的差异 SVPWM算法详解(已标注重点) 来自这篇文章,但经过实际测试,发现是…

计算机和医学领域成重灾区!5本TOP刊也位列其中,请大家谨慎投稿!

【SciencePub学术】自从Hindawi一年撤稿多达一万多篇的事件以来,官方对期刊质量的管控就越来越严格了。更有很多学校和单位都频频更新自己的风险期刊名单,其中,Hindawi、Frontiers、MDPI甚至都被直接打包拉黑! 更有On Hold 期刊现…

ios上音频需要点击两次才播放

问题 用H5标签audio渲染音频,测试PC和安卓都没有问题,点击一次就播放,并且可以在播放之前正常显示音频时长 但是在iOS系统上没有播放之前,不仅时长显示为0,并且播放还需要点击2次才正常播放 原因 debug之后发现是因为…