大数据概论

news2024/11/18 17:27:02

大数据概论

  • 大数据概论
    • 概念
    • 特点(4V)
      • Volume(大量)
      • Velocity(高速)
      • Variety(多样)
      • Value(低价值密度)
    • 应用场景
    • 发展前景
    • 部门间业务流程分析
    • 部门组织结构

大数据概论

概念

大数据(BigData),指 无法在一定时间范围内 \textcolor{Red}{无法在一定时间范围内} 无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的 衡量、高增长率和多样化的信息资产 \textcolor{Red}{衡量、高增长率和多样化的信息资产} 衡量、高增长率和多样化的信息资产

按顺序给出数据单位:bit Byte KB MB GB T B \textcolor{Red}{TB} TB P B \textcolor{Red}{PB} PB E B \textcolor{Red}{EB} EB ZB YB BB NB DB

特点(4V)

Volume(大量)

截至目前,人类生产的所有 印刷材料的数据量是 200 P B \textcolor{Red}{印刷材料的数据量是200PB} 印刷材料的数据量是200PB,而历史上全人类总共 说过的话的数据量大约是 5 E B \textcolor{Red}{说过的话的数据量大约是5EB} 说过的话的数据量大约是5EB。当前典型个人计算机的硬盘的容量为 TB 级别,而一些 大企业的数据量已经接近 E B 量级 \textcolor{Red}{大企业的数据量已经接近 EB 量级} 大企业的数据量已经接近EB量级

Velocity(高速)

这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告,预计到2025年,全球数据使用量将达到163ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。

Variety(多样)

这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以数据库/文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。

Value(低价值密度)

价值密度的高低与数据总量的大小成反比

应用场景

  1. 物流仓储:大数据分析系统助力商家精细化运营、提升销量、节约成本。
  2. 抖音:推荐的都是你喜欢的视频
  3. 电商站内广告推荐:给用户推荐可能喜欢的商品
  4. 零售:分析用户消费习惯,为用户购买商品提供发布,从而提升商品销量
  5. 保险:海量数据挖掘及风险预测,助力保险行业精准营销,提升精细化定价能力。
  6. 金融:多维度体现用户特征,帮助金融机构推荐优质客户,防范欺诈风险。
  7. 房产:大数据全面助力房地产行业,打造精准投策与营销,选出更合适的地,建造更合适的楼,卖给更合适的人。
  8. 人工智能 + 5G + 物联网 + 虚拟与现实

发展前景

  1. 党的十九大提出“推动互联网、大数据、人工智能和实体经济的深度融合

  2. 2020年初,中央推出34万亿“新基建”投资计划

  3. 2020年是5G的元年,国家在大力铺设5G设备,2021年就是5G手机应用的开始,也是大数据要爆发的1年。5G带来的是每秒钟10g的数据,会给每家公司都带来海量的数据。那么传统的Java工具根本解决不了海量数据的存储。就更不用说海量数据的计算了。如果你对5G的感触不够深,可以回忆一下3G和4G的区别。3G时只能打电话、发短信,当时还觉得很好,觉得3G不错。但是4G来了后,大家很少打电话和发短信了,都改为语音、视频、直播、网上购物等生活方式,带火了淘宝、京东、美团、字节跳动等企业。没有跟上节奏的百度,有点摇摇欲坠

    自古不变的道理:先入行者吃肉,后入行者喝汤,最后到的买单!

  4. 人才紧缺、竞争压力小

    有句话叫:“选择大于努力”选择一个好的方向,少奋斗十年。是否记得国家在2017年才开设大数据课程,当时是北京大学、人民大学等25所高校开设第一批大数据课程。今年才2021年。也就是今年才毕业,那么像Java、前端大学已经开设多少年了,包括培训班都加在一起,10多年,可想而知目前市场上,Java和前端的人才有多少。

    大数据的人才目前除了培训机构培养的,没有真正的科班毕业,而且真正能培养好大数据人才的培训机构又有几个。 所以目前选择大数据是最佳选择。

    如果担心自己不是科班,其实也大可不必,因为大学真的学不了啥。只要是能考上大专科,说明你不笨,那学大数据就没问题。

部门间业务流程分析

部门组织结构

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/149318.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

iOS—Effective Objective—C2.0(2)

文章目录对象,消息,运行期理解“属性”概念合成与存取dynamic关键字属性特性原子性读/写权限内存管理语义方法名为什么几乎所有的属性都可以使用nonatomic:要点在对象的内部尽量直接访问实例变量惰性初始化:要点理解“对象同等性”…

2022年度总结——平凡之路

文章目录一、缘起二、回首2022三、展望2023四、结束语我是平凡的人,总要接受普通平凡的自己。一、缘起 我注册CSDN的时间是2021-07-25,这是一个值得纪念的时间。不过那时候的我并没有写博客,只是在CSDN游览一些文章,查看资料&…

一文读懂Java垃圾回收机制及算法原理万字详解

Java垃圾回收机制及算法 文章目录Java垃圾回收机制及算法垃圾回收概述垃圾回收-对象是否已死判断对象是否存活 - 引用计数算法判断对象是否存活-可达性分析算法可达性分析算法JVM之判断对象是否存活再谈引用垃圾收集算法分代收集理论标记-清除算法什么是标记-清除算法?标记-复…

读书:《卡片笔记写作法》

2023年罗胖跨年演讲时提到了一个故事,说Flomo的创始人有3个原则:一不在软件内弹广告,二不做永久会员,三不融资。我就马上试用了一下这款Flomo软件,然后就发现了《卡片笔记写作法》这本书。 这本书的卡片写作法来自于一…

【Qt】QtCreator新建Application项目的6类应用程序的示例

【Qt】QtCreator新建Application项目的6类应用程序的示例1、背景2、Application分类1、背景 操作系统:windows10专业版。 Qt版本:qt-opensource-windows-x86-msvc2013_64-5.7.1.exe 注意:安装了该exe可执行文件,就自动安装了qtcr…

(考研湖科大教书匠计算机网络)第一章概述-第一节:因特网概述

文章目录一:网络、互联网和因特网基本概念二:因特网发展的三个阶段三:ISP和基于ISP的三层结构的因特网(1)ISP(2)基于ISP的三层结构的因特网四:因特网的标准化工作五:因特…

KMP算法--子串查找问题

目录 一.前言 二.KMP算法简介 三.关键概念1:字符串的前后缀 四. 关键概念2:字符串相等前后缀与最长相等前后缀长度 五.关键概念3:Next数组 六.Next数组在算法中的应用: 七.模式串Next数组的构建 先膜拜一下三位神仙&#x…

面试前端数组去重,我会问这3个小问题

关于数组去重,已经是一个老生常谈的问题了,网络上已经有N篇关于数组去重的讲解了,所以,凡是能看见这篇博客的,我们都是有缘人,希望2023年你可以乘风破浪,职击沧海。而一般面试的时候&#xff0c…

MySQL调优-高性能业务表结构设计

目录 前言记录: 数据库表设计 范式设计 什么是范式? 数据库设计的第一范式 数据库设计的第二范式 数据库设计的第三范式 范式说明 反范式设计 什么叫反范式化设计? 反范式设计-商品信息 范式化和反范式总结 实际工作中的反范式实…

C++ stack和queue

1. stack的介绍和使用1.1 stack的介绍1. stack是一种容器适配器,专门用在具有后进先出操作的上下文环境中,其删除只能从容器的一端进行元素的插入与提取操作。2. stack是作为容器适配器被实现的,容器适配器即是对特定类封装作为其底层的容器&…

基于深度学习的自然语言处理

1、什么是自然语言处理? 自然语言处理(Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、…

【信号与系统】预习笔记(每日更新ing)

2023.1.8已打卡 信号与系统(一)信号与系统概述1.0 常见三角公式1.1 信号与系统1.2 信号的表述、分类1.3 信号的运算(二)连续系统的时域分析(三)离散系统的时域分析(四)傅里叶变换与频…

软件质量保证与软件测试复习文档

目录 引言: 内容: 一、Ron patton《软件测试》中谈到的软件缺陷的定义被业界广泛认可,主要包括哪五条? 二、软件测试人员的主要工作职责是什么,一般围绕哪几个重要文档开展工作? 三、什么是软件测试模…

差分算法介绍

一、基本概念 差分算法是前缀和算法的逆运算,可以快速的对数组的某一区间进行计算操作。 例如,有一数列 a[1],a[2],.…a[n],且令 b[i] a[i]-a[i-1],b[1]a[1],那么就有 a[i] b[1]b[2].…b[i] a[1]a[2]-a[1]a[3]-a[2].…a[i]-a[i…

电脑开机密码忘记了怎么办?

相信很多朋友为了保护自己的隐私,都会在自己的电脑设置开机密码,但有时候电脑太久没用,就有可能忘记开机密码了,这可怎么办?别着急,今天就跟大家分享两种苹果电脑忘记开机密码解决方式,适用于Ma…

使用Junit进行单元测试的简单例子

首先新建一个工程,选择合适的路径和JDK版本,其它默认就行。 把Main.java内容改为如下。 后面就是对add方法增加单元测试 public class Main {public static void main(String[] args) {System.out.println("Hello world!");}public static i…

计算机网络——应用层协议原理

目录 1. 网络应用体系结构 1.1 客户机/服务器结构 1.2 P2P结构 1.3 混合结构 2. 进程通信 2.1 标识进程通信 2.2 套接字(socket) 3. 网络应用的服务需求 3.1 可靠数据传输 3.2 吞吐量 3.3 定时 3.4 安全性 3.5 常见网络应用的要求 4. 因特网提供的传输服务…

ArcGIS基础实验操作100例--实验69布局中添加报表和Excel图表

本实验专栏参考自汤国安教授《地理信息系统基础实验操作100例》一书 实验平台:ArcGIS 10.6 实验数据:请访问实验1(传送门) 高级编辑篇--实验69 布局中添加报表和Excel图表 目录 一、实验背景 二、实验数据 三、实验步骤 &…

最快的表格:Dapfor Wpf GridControl

Dapfor Wpf GridControl 特性Wpf GridControl 是我们网格的第三个版本,它基于 WPF 技术。前两个产品是基于Microsoft WinForms 技术的MFC Grid 和.Net Grid。在网格的第三次迭代中,Dapfor 的专家采用了以前产品的最佳功能,从而产生了比其他供…

(4)go-micro微服务proto开发

文章目录一 Protobuf介绍二 安装Protobuf三 Protobuf语法1.1 基本规范1.2 字段规则1.3 service如何定义1.4 Message如何定义四 proto代码编写五 生成.go文件六 最后一 Protobuf介绍 Google Protocol Buffer( 简称 Protobuf) 是 Google 公司内部的混合语言数据标准,…