大数据是什么?

news2024/10/5 14:23:37

1.什么是数据?

数据是什么?什么样的称之为数据呐?我想找个问题提出来,各位小伙伴一定会喷我,脸数据都不知道的还在写什么大数据?但是我们转身再想一想,数据,我们真的了解本质吗?就好比如,你理解的什么是数据?是只存在于计算机里流通的数据流?还是文本记录的文字,还是你跟别人说的一句话,又或者是你在逛商场的时候被摄像机录下画面,你说他们都是数据,嗯~~没错,他们是都是数据,但是从某些方面来说,他们也可能不是数据。

我想学习大数据的同学可能都从网上的一些资料了解过数据的5V性质,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值密度)和Veracity(真实性),是吧。但是咱们聊点不一样的哈,上面是国外人总结的,也不一定对,毕竟前任总结出来的经验只是让我们能够走得更远而不是以前人的基础为框架,在里面绕圈,要不然社会还怎么进步,是吧,希望读到我这篇文章的小伙伴不要把自己的思维限制在固有知识体系上,如果是还没入门的还是建议大家以以前的知识体系去走,我怕我有些发散思维在某些方面会带偏你,毕竟你想要的是整个大数据的知识体系,虽然我这也覆盖,但是有些东西说出去可能大家也会思考,不如你说的答案就是大家公认的好,毕竟要工作的。整体的学习的路线应该是下面:

接上面,咱们继续聊哈~虽然有国外的专业人士总结出的5V特性也有4V特性的但无论几V特性,他都是在定义大数据,但是什么的是数据,你能从他们总结的特性里面说出来嘛?又或者是你理解的数据能解释出来,文字、图片、影像等等。对,没有错,一切所有能够被描述、记录的都是数据

看到这是不是感觉自己看了个寂寞?但是你想一想,你以前所认知的数据知识具象化存在的,难道幻想的东西就不是数据了?以前你只能说出某一具体事物,但是难道其他的就不是数据了?所以,小编人为一切能够被描述、记录的都是数据,这就是数据都得本质。(f发散思维哈~不喜勿喷,可以再评论区讨论哈)

2.数据的特性

顺着我上面的题来说哈,一切能够描述、记录的都是数据,不知道小伙伴们有没有接触过用户画像哈,一个用户画像总会有很多特性,例如电商的用户画像会有喜爱偏好、年龄、性别等等这些数据让我们通过数据来分析他的行为习惯从而给他推荐他最有可能购买的商品,从而提高销售额。

那我们如果把整个数据当成一个物体来做分析的话,他又有哪些特性呐?能够让我们更快的了解他呐?以下的性质说的是数据并非大数据,为纯属小编自己理解,并不具有专业的性质定义,供大家学习参考

1.时效性

时效性,原本是定义为存储性的,但是存储性集市小编自己也还是觉得有争议的,因为有些数据并不具备存储性,难道他就不是数据了?例如一个杯子,一个杯子的长宽高、颜色、重量等等这些东西他都是数据,但这些数据有可能只是我们看了一眼,并没有存储,难道这些就不是数据了?所以小编就得时效性更能代替存储性,像上面的描述,他是一段数据,只不过他的时效性很短,只存在于我们对他的认知这一时刻,虽然后面也许会有其他人也会认识他,虽然是描述同一物体的,但是我们认知的数据与其他人认知的数据可能存在偏差,而且这样的数据如果大脑没有进行存储的haul,那么只会存在于我们认识它的时候。存在的时间较短。而另一方面,我们中华上下五千年存在文明,他也是一种数据,而且他是被人记录下来的,供我们后人学习,所以它存在的时间相对较长,因为长时间的存储我们才有学习的资格,所以说数据是有时效的。

2.多样性

我相信这个大家肯定都能理解,数据有用多样性,并不是指单一的物体,例如我们上面所讲的,杯子的物体描述是数据,文化传承是数据,一个人的性别、年龄也是数据,摄像摄像记录的信息也是数据,幻想的小说是数据、做的梦也是数据,一切可以被描述、记录的都是数据,一切就代表了所有,所有就是多样。所以,数据还具有多样性

3.价值性

价值性,这个无论是古代还是现代,都能体会到数据的价值,例如在古代,烽火戏诸侯的典故,里面的狼烟就是在向其他诸侯国传递一种信息,我被打了,快来人啊。所以收到狼烟的信息后,诸侯国出兵拥王,这个信息的价值就很高啊,因为它单独就能决定一件事物的走向,狼烟起救王,无烟各自安好。随着科技技术的日益发展,我们现在的社会是信息化的社会,平常上网购个物、出个门旅个游、玩个游戏等等,这些行为记录也都是数据,会被各个商家收集起来,但是这些数据的价值就比较低了,因为这些数据即使收集起来,单条的数据也无法对你个人起决定左右,但是大数据就不一样了。所以数据具有一定的价值。

4.规律性

这个规律性是相对的,得跟时效性结合起来看~不是绝对的,例如:我今天就说了5个字,我随手扔了一个垃圾被大爷看到了,这只是一小事,并没有啥规律,但是如果是我每天起床说了5个字和我每天扔垃圾都被大爷看到了,那么这两个就是规律,不是啥大规律,只是我个人的生活规律而已。由此你可以分析出我个人的很多信息,这个我们就不在这细说了,毕竟是个人隐私。但是数据的规律性是可以体现出来的,除此之外,天下大势,分分合合,合合分分,哪里有压迫,哪里就有反抗,等等这些历史都能告诉我们,数据是存在规律的,但是一定要结合数据的时效性来看哈,一秒的数据是没有规律的,但是一百秒或者一万秒说不定就存在一个细微的规律,大家平常可以好好的观察一下自己的生活哈。

以上就是小编个人总结出来的数据特性,您还认为哪些可以成为数据的特性,一起来评论区畅聊一下吧。以下是小编自己搜集的学习资料免费分享给大家。课程以后也会继续更新的。需要的M我。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1184699.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

5G边缘计算网关的功能及作用

5G边缘计算网关具有多种功能。 首先,它支持智能云端控制,可以通过5G/4G/WIFI等无线网络将采集的数据直接上云,实现异地远程监测控制、预警通知、报告推送和设备连接等工作。 其次,5G边缘计算网关可以采集各种数据,包…

虚拟机ping不通百度,SecureCRTPortable连接不上

虚拟机ping不通百度,SecureCRTPortable连接不上 文章目录 虚拟机ping不通百度,SecureCRTPortable连接不上1、打开虚拟网络编辑器2、更改设置3、NAT设置4、设置网关4、设置网关 cat /etc/sysconfig/network-scripts/ifcfg-ens33 TYPEEthernet PROXY_METHO…

Web Worker:JS多线程的伪解药?

前言 在前端开发领域,JavaScript 的单线程限制一直是一个难以忽视的挑战。当谈到解决JavaScript的单线程限制时,HTML5引入的Web Worker被普遍认为是一剂解药💊。同时,业界中大量的文章也是聚焦于讨论web worker的神奇力量。然而&…

Banana Pi BPI-M6开源硬件开发板介绍以及与 Raspberry Pi 5 的比较

Banana Pi BPI-M6 Banana Pi BPI-M6是Banana-Pi组织最新开发的一款类似于Raspberry Pi的单板计算机,具有相同的尺寸格式和相似的功能。 今天我想向您介绍这些功能,并将它们与新的 Raspberry 5 提供的功能进行一些比较。 Raspberry Pi是英国 Raspberry P…

Cesium教程(二十):动态加载图片

1、效果预览 备注: 箭头图片可以去这里下载:箭头下载地址 2、代码编写 创建容器 <div id="cesiumContainer" class="fullSize"

软件版本控制系统VCS工具——cvs vss svn git

版本控制 版本控制系统&#xff08;Version Control System&#xff0c;VCS&#xff09;是用于跟踪和管理源代码和文档的工具。可追踪和管理修改历史&#xff0c;包括修改的内容、时间、作者等信息。有助于团队协作、追踪变更、恢复历史版本等。VCS的主要目的是帮助团队协作开…

竞赛选题 深度学习机器视觉车道线识别与检测 -自动驾驶

文章目录 1 前言2 先上成果3 车道线4 问题抽象(建立模型)5 帧掩码(Frame Mask)6 车道检测的图像预处理7 图像阈值化8 霍夫线变换9 实现车道检测9.1 帧掩码创建9.2 图像预处理9.2.1 图像阈值化9.2.2 霍夫线变换 最后 1 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分…

Pytest系列(16)- 分布式测试插件之pytest-xdist的详细使用

前言 平常我们功能测试用例非常多时&#xff0c;比如有1千条用例&#xff0c;假设每个用例执行需要1分钟&#xff0c;如果单个测试人员执行需要1000分钟才能跑完当项目非常紧急时&#xff0c;会需要协调多个测试资源来把任务分成两部分&#xff0c;于是执行时间缩短一半&#…

【gogogo专栏】golang并发编程

golang并发编程 并发编程的工具goroutine介绍协程管理器sync.WaitGroup channel介绍readChannel和writeChannelclose的用法select的用法 通讯示例总结 并发编程的工具 在golang中&#xff0c;并发编程是比较简单的&#xff0c;不像java中那么麻烦&#xff0c;golang天然的支持协…

便携式电能质量分析仪

产品简介 KDZD5000电能质量分析仪是我公司精心研制的现场测试的三相、多功能、智能化、人机操作简洁的综合型测试仪器。具有容易使用&#xff0c;超大液晶彩屏显示&#xff0c;高分辨率&#xff0c;中英文双语操作界面&#xff0c;防振结构外壳等特点。可同时测量4路电流&…

Cesium 展示——拖拽点移动相邻线也跟着更新

文章目录 需求分析1. 获取所要移动实体的 ID2. 移动点相邻线跟着更新移动3. 注意4. 其他需求 实现 拖拽点移动相邻线也跟着更新 拖拽前 点击拖拽 拖拽后 分析 1. 获取所要移动实体的 ID 在Cesium中获取指定(x, y)位置处的实体ID,你可以通过以下步骤实现: 首先,使用Cesi…

2023年【化工自动化控制仪表】考试报名及化工自动化控制仪表考试试卷

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 2023年化工自动化控制仪表考试报名为正在备考化工自动化控制仪表操作证的学员准备的理论考试专题&#xff0c;每个月更新的化工自动化控制仪表考试试卷祝您顺利通过化工自动化控制仪表考试。 1、【单选题】CENTUMCS30…

【自定义控制器View的懒加载 Objective-C语言】

一、控制器的View懒加载 1.大家对这个懒加载是什么概念: 把上节课的代码command + C、command + V、保存一个副本,把副本命名为03-控制器的view的懒加载: 是不是用到的时候,再去加载,然后呢,只加载一次,对吧, 那这些重复的,我就删掉了啊, 删掉 控制器里面: 这个删…

PV与PVC

emptyDir存储卷 概述&#xff1a; 当Pod被分配给节点时&#xff0c;首先创建emptyDir卷&#xff0c;并且只要该Pod在该节点上运行&#xff0c;该卷就会存在。正如卷的名字所述&#xff0c;它最初是空的。Pod 中的容器可以读取和写入emptyDir卷中的相同文件&#xff0c;尽管该…

软件开发中常见的设计原则

软件开发中常见的设计原则 1. 单一责任原则2. 开放封闭原则3. 里氏替换原则4. 接口分离原则5. 依赖倒置原则6. 迪米特法则7. 合成复用原则8. 共同封闭原则9. 稳定抽象原则10. 稳定依赖原则 简写全拼中文翻译SRPThe Single Responsibility Principle单一责任原则OCPThe Open Clo…

Flink--Data Source 介绍

Data Source 简介 Flink 做为一款流式计算框架&#xff0c;它可用来做批处理&#xff0c;即处理静态的数据集、历史的数据集&#xff1b;也可以用来做流处理&#xff0c;即实时的处理些实时数据流&#xff0c;实时的产生数据流结果&#xff0c;只要数据源源不断的过来&#xff…

前端面试题之Javascript篇

一、JavaScript基础 1、数组有哪些方法 添加/删除元素 push() 向尾部添加元素pop() 从尾部提取一个元素shift() 从首端提取元素unshift() 从首端添加元素splice(start, deleteCount, item1...itemN) start表示开始计算的索引&#xff0c;deleteCount表示从start开始计算的元…

PTA_乙级_1006

思路&#xff1a;把数字的每一位都取出来&#xff0c;然后for循环把字符输入 #include <iostream> #include <string> using namespace std;int main() {int n;cin >> n;int b n / 100; // 计算百位数int s (n % 100) / 10; // 计算十位数int g n…

大学智能电表改造解决方案

随着科技的不断发展&#xff0c;我国高等教育院校在基础设施方面也在不断进行智能化升级。电力系统作为大学校园的重要组成部分&#xff0c;对其进行智能化改造已成为当前高校建设的热门话题。本文将详细介绍大学智能电表改造解决方案&#xff0c;以期为我国高校的电力系统智能…

Unity Input System最简单使用

开始学的是 Input Manager 比较好理解&#xff0c;Input System却不好理解&#xff0c;教程也找了很多&#xff0c;感觉都讲的不清楚&#xff0c;我这里做一个最简单的用 Input System 添加鼠标左键和右键的效果。 1. 安装 Input System 包 首先这个功能不是内置的&#xff0…