大数据概述(林子雨慕课课程)

news2024/11/26 17:48:13

文章目录

    • 1. 大数据概述
      • 1.1 大数据概念和影响
      • 1.2 大数据的应用
      • 1.3 大数据的关键技术
      • 1.4 大数据与云计算和物联网的关系
        • 云计算
        • 物联网

1. 大数据概述

  • 大数据的四大特点:大量化、快速化、多样化、价值密度低

1.1 大数据概念和影响

  • 大数据摩尔定律
image-20230926145239672
  • 大数据由结构化和非结构化的数据组成,非结构化的数据占比大,如图像数据

    image-20230926145401781
  • 结构化的数据就是关系数据库表中的图表数据

  • 非结构化的数据种类繁多

    image-20230926145534691

  • 大数据从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少,必须实现秒级决策

  • 价值密度低,商业价值高

  • 大数据的影响

    • 全样非抽样:因为现在存储廉价,数据可以全部保存,不在需要抽样进行统计分析
    • 效率而非精确:因为从前的抽样的结果误差放在全样上会被放大,现在基于全样的分析不存在效率问题
    • 相关而非因果:大数据时代追求的更多的追求数据之间的相关性,而非因果关系

1.2 大数据的应用

image-20230926150537411

1.3 大数据的关键技术

  • 四个关键技术
image-20230926150853710
  • 两大核心技术:分布式存储和分布式处理
    • 分布式存储:解决海量数据的存储问题

      • 分布式数据库,以及分布式文件系统
    • 分布式处理:解决海量数据的处理问题

      • 分布式并行处理技术
image-20230926151045548
  • 不同的计算模式需要不同产品:批处理、流计算、图计算、查询分析计算

    • MapReduce是批处理计算模式的典型代表,其无法满足实时要求
    • 流计算:流数据需要实时处理,给出实时响应,否则分析结果会失去商业价值
      • S4+Storm+Flume
    • 图计算:代表Goole Pregel 设计可以高效处理图流数据的产品
    • 查询分析计算:秒级响应,实现交互式计算,如Google Dremel、Hive、Cassandra
    image-20230926151927900

1.4 大数据与云计算和物联网的关系

云计算
  • 云计算:解决海量数据的分布式存储问题和分布式处理问题

    • 典型特征:虚拟化、多租户
    • 概念:云计算是通过网络以服务的方式为用户提供非常廉价的IT资源
    • 优势:企业无需自建IT基础设施,可以租用云端资源
    • 云的三种模式
  • 云计算的三种模式

    image-20230926152321989
    • 公有云:构建的云平台是面对所有公众服务的:如百度云

    • 私有云:企业内部自己构建的面对企业内部员工的云平台

    • 混合云:构建的云平台部分给自己用,部分给外面用

  • 三种云服务:

    image-20230926152709877
    • IaaS:基础设施即服务

      • 将基础设施(计算资源和存储)作为服务出租
    • PaaS:平台即服务

      • 开发云产品:在别人提供的云服务环境中,利用其提供的接口,开发各种云服务产品,也部署到其分布式环境中去

        image-20230926153034561

    • SaaS:软件即服务

      • 将云中心财务软件买卖给你
  • 虚拟化和多租户:

    image-20230926153457276
  • 云计算数据中心:各种数据和应用,并非在天上云端,而是位于数据中心里

    • 其应用广泛
    image-20230926153919564
物联网
  • 概念:物联网(IoT:The Internet of Things)物联网就是物物相连的互联网,是互联网的延伸

  • 物联网的层次架构

    image-20230926154132177
  • 物联网的关键技术:识别和感知技术

  • 物联网的应用:

    image-20230926154459910
  • 云计算和物联网的关系:

    image-20230926154650537

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1070612.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【unity】制作一个角色的初始状态(左右跳二段跳)【2D横板动作游戏】

前言 hi~ 大家好!欢迎大家来到我的全新unity学习记录系列。现在我想在2d横板游戏中,实现一个角色的初始状态-闲置状态、移动状态、空中状态。并且是利用状态机进行实现的。 本系列是跟着视频教程走的,所写也是作者个人的学习记录笔记。如有错…

Decorator

Decorator 动机 在某些情况下我们可能会“过度地使用继承来扩展对象的功能”, 由于继承为类型引入的静态特质,使得这种扩展方式缺乏灵活性; 并且随着子类的增多(扩展功能的增多),各种子类的组合&#xff…

Ubuntu右上角不显示网络的图标解决办法

一.line5改为true sudo vim /etc/NetworkManager/NetworkManager.conf 二.重启网卡 sudo service network-manager stop sudo mv /var/lib/NetworkManager/NetworkManager.state /tmp sudo service network-manager start

全网最详细的本地搭建GitLab代码仓库教学

大体的步骤 本地安装VMware虚拟机。然后再虚拟机上安装CentOs7镜像系统。在Linux中安装GitLab-Ce。在Linux中安装GitLab-Runner在自己搭建的GitLab上面创建一个项目,然后拉取到本地然后提交之后实现自动化部署。 步骤一 这一步骤我在之前我的安装Redis文章中有讲解…

关于Jupyter notebook 创建python3 时进去不能重命名问题及不能编程问题

首先写这篇博客时,已经被这个问题折磨了三天,看了很多博客,其实解决这个问题的关键就是要么没有下pyzmq或者等级太高,要么等级太低,首先我会按照我思路来。 问题如图: 1.自动换行 2.不能重命名 我的解决办…

学习记忆——数学篇——案例——算术——绝对值三角不等式

第一步:记住公式,绝对值差,和差绝对值,绝对值和 第二步:记住口诀:取等条件:中间相加取等号,左异右同零取到;中间相减取等号,上面符号方向调 题型记忆法 歌诀记…

【Cents OS7 安装 Docker以及DockerCompose】

文章目录 0.安装Docker1.CentOS安装Docker1.1.卸载(可选)1.2.安装docker1.3.启动docker1.4.配置镜像加速 2.CentOS7安装DockerCompose2.1.下载2.2.修改文件权限2.3.Base自动补全命令: 3.Docker镜像仓库3.1.简化版镜像仓库3.2.带有图形化界面版…

SLAM从入门到精通(ROS和底盘Stm32的关系)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 学过Ros的同学,一般对subscribe、publish、话题、服务这些内容都比较熟悉。如果再熟悉一点的话,还会知道slam、move_base、…

好物周刊#10:算法学习必备

https://cunyu1943.github.io https://yuque.com/cunyu1943 村雨遥的好物周刊,记录每周看到的有价值的信息,主要针对计算机领域,每周五发布。 一、项目 1. ChatGPT-Midjourney 该项目基于 ChatGPT-Next-Web 开发,只要拥有自己…

聪明应对工程项目管理难题的方法和技巧

对于国内的工程项目管理中,经常需要面对以下几个问题: 1.项目问题相互牵扯,积累成堆:通常一个问题不能及时的解决,就会导致更多的任务无法完成,问题越堆积越严重。 2.项目延期,增加成本&#xf…

【leetcode】 vscode leetcode [ERROR] invalid password? 问题解决

目录 问题解决 问题 使用vscode连接leetcode出现下列问题: vscode leetcode [ERROR] invalid password?出现invalid password?的问题,首先需要检查账号密码是否出错,leetcode的账号可以是手机或邮箱,然后密码去check一下&…

Anaconda3-2023.07-2安装和配置教程

Anaconda3-2023.07-2安装和配置教程 前言一、彻底卸载python1、卸载python2、删除环境变量 二、下载Anaconda方式一:官网下载方式二、镜像站下载 三、安装Anaconda3四、配置环境变量五、检验安装是否成功1、查看anaconda版本2、查看python版本3、查看Anaconda Navif…

C (1094) : DS双向链表—前驱后继

Description 在双向链表中,A有一个指针指向了后继节点B,同时,B又有一个指向前驱节点A的指针。这样不仅能从链表头节点的位置遍历整个链表所有节点,也能从链表尾节点开始遍历所有节点。 对于给定的一列数据,按照给定的…

springboot2.7.15集成springcloud,springcloudalibaba

spring-cloud官方中文文档 spring-cloud官方文档 Spring Cloud Alibaba官方文档 这边用的是springboot2.7.15以下是集成springcloud,springcloudalibaba的版本推荐 <dependencyManagement><dependencies><!--SpringBoot整合Spring Cloud--><dependency…

梯度裁剪:torch.nn.utils.clip_grad_norm_详解

梯度裁剪是为了防止梯度爆炸。在训练FCOS算法时&#xff0c;因为训练过程出现了损失为NaN的情况&#xff0c;在github issue有很多都是这种训练过程出现loss为NaN&#xff0c;使用torch.nn.utils.clip_grad_norm_梯度裁剪函数&#xff0c;可以有效预防梯度爆炸的情况发生。 1 …

OpenCV4(C++)—— 图像阈值化

文章目录 前言一、固定阈值化 —— threshold二、自适应阈值化 —— adaptiveThreshold三、LUT查找表 前言 图像阈值化在许多计算机视觉和图像处理任务中都是一个重要的预处理步骤。在边缘检测过程中&#xff0c;通过将图像转换为二值图像&#xff0c;可以突出图像中的边缘信息…

Qt:多语言支持,构建全面应用程序“

Qt&#xff1a;强大API、简化框架、多语言支持&#xff0c;构建全面应用程序" 强大的API&#xff1a;Qt提供了丰富的API&#xff0c;包括250多个C类&#xff0c;基于模板的集合、序列化、文件操作、IO设备、目录管理、日期/时间等功能。还包括正则表达式处理和支持2D/3D…

制作长图海报的详细指南,制作长图海报的5个步骤

制作长图海报是宣传活动、产品或服务的重要方式之一。乔拓云后台提供了丰富的海报模板&#xff0c;让你轻松制作出专业级的长图海报。下面将介绍如何使用乔拓云后台制作长图海报的技巧。 一、选择模板 首先&#xff0c;注册并登录乔拓云后台&#xff0c;进入云设计页面。在选择…

C语言学生成绩录入系统

一、系统概述 该系统是一个由链表创建主菜单的框架&#xff0c;旨在快速创建学生成绩录入系统的主菜单结构。其主要任务包括&#xff1a; 实现链表的创建、插入和遍历功能&#xff0c;用于存储和展示学生成绩录入系统各个模块的菜单项。 2. 提供用户友好的主菜单界面&#xf…

证件照换底色详细教程

说到证件照的底色更改&#xff0c;我想对大部分朋友来说是蛮头疼的事情&#xff0c;由于我们不论是在生活还是学习中&#xff0c;有时候总会要上传一些证件照&#xff0c;而当你手上有证件照准备上传时&#xff0c;发现底色不对&#xff0c;是不是很抓狂&#xff0c;现在&#…