BIG DATA —— 大数据时代

news2025/3/13 8:28:50

大数据时代

[英] 维克托 · 迈尔 — 舍恩伯格     肯尼斯 · 库克耶 ◎ 著  盛杨燕     周涛◎译

《大数据时代》是国外大数据研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据商业应用第一人”,他在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。

舍恩伯格最具洞见之处在于,指出大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。

本书认为大数据的核心就是预测,大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。

                                                                                                                                          —— 网络

 读后感

引言

        在一开始作者举例在流感中之所以谷歌可以预测冬季流感的传播。 就是因为谷歌保存了每天来自全球的30亿条搜索指令。奥伦 · 埃奇奥尼通过大数据解释了为什么季节影响飞机票的价格,他把这个发现命名为 “哈姆雷特”。于是他收购了Farecast公司,这时的预测准确率已经高达75%, 平均每张机票节省50美元。

天文学,信息爆炸的起源

信息爆炸的起源可以追溯到多个领域的发展,而天文学是其中的一个重要领域。随着计算机技术的全面融入和社会的发展,天文学在数据收集和处理方面取得了巨大的进步。在这个过程中,天文学家们积累了大量的观测数据,这些数据主要依赖于观测电磁辐射获得。这些数据的增长速度非常快,远超过了传统数据处理和分析的能力,从而形成了信息爆炸的现象。

具体来说,天文学作为信息爆炸的起源之一,主要体现在以下几个方面:

  1. 观测技术的进步:随着望远镜和探测器技术的不断改进,天文学家能够观测到更远的星系、更暗的天体和更精细的结构。这些观测技术的进步使得数据量迅速增长,为信息爆炸提供了丰富的原始素材。
  2. 数据处理技术的发展:随着计算机技术的不断进步,数据处理和分析能力得到了极大的提升。这使得天文学家能够更高效地处理和分析大量的观测数据,从而发现更多的天文现象和规律。
  3. 跨学科的合作与交流:天文学与其他学科的交叉融合,如物理学、数学、计算机科学等,为信息爆炸提供了更多的可能性。这些跨学科的合作与交流促进了数据共享和资源整合,进一步推动了信息爆炸的发展。

                                                                                                                                           ——网络

国际单位制前缀&字节

在书中多次提到国际单位制(SI)前缀

  1. 千(kilo):10³        或者1000
  2. 百万(mega):10⁶ 或者1,000,000
  3. 十亿(giga):10⁹   或者1,000,000,000
  4. 兆(tera):10¹²      或者1,000,000,000,000
  5. 拍(peta):10¹⁵     或者1,000,000,000,000,000
  6. 艾(exa):10¹⁸      或者1,000,000,000,000,000,000
  7. 泽(zetta):10²¹    或者1,000,000,000,000,000,000,000
  8. 尧(yotta):10²⁴    或者1,000,000,000,000,000,000,000,000
  9. 毫(milli):10⁻³     或者0.001
  10. 微(micro):10⁻⁶  或者0.000001
  11. 纳(nano):10⁻⁹   或者0.000000001
  12. 皮(pico):10⁻¹²   或者0.000000000001
  13. 飞(femto):10⁻¹⁵ 或者0.000000000000001
  14. 厄(atto):10⁻¹⁸    或者0.000000000000000001
  15. 兹(Zepto):10⁻²¹ 或者0.000000000000000000001
  16. 幺(Yocto):10⁻²⁴ 或者0.000000000000000000000001

据了解人类在2007年就储存了300艾字节

字节 Byte:

1Byte = 8bit, 俗称1大B = 1小b。

Byte进制是1024,艾字节到泽字节的进位就是1024 = 2¹⁰。

 模拟数据&数字数据

众所周知使用东西是一般分为获取数据——传输数据——处理数据——发挥作用

模拟数据和数字数据是两种主要的数据类型,它们在表示、传输和处理数据时有显著的不同。

模拟数据(Analog Data)是指连续变化的数据,它们可以取任意值,并且在时间和幅度上都是连续的。例如,温度、压力、声音、图像等都属于模拟数据。模拟数据的特点是可以平滑地变化,没有固定的量化级别。这种类型的数据通常通过模拟信号进行传输,如电话线中的语音信号或电视广播中的图像信号。

数字数据(Digital Data)则是以离散的数值形式表示的数据。在计算机科学中,数字数据通常是用二进制代码(0和1)表示的。这种数据类型只能取特定的、离散的数值。0表示恒定的负电压,1表示恒定的正电压。

 作者一直强调量变 = 质变,全数据模式 样本 = 总体这是很正确的, 作者在书中举例一个图片和一个视频有什么区别(量变 = 质变)。

我推荐大家看一下这本书:

谢谢大家,欢迎点赞, 收藏,关注。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1453712.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微服务—DSL基础语法与RestClient操作

本博客为个人学习笔记,学习网站:黑马程序员SpringCloud 2021教程 目录 DSL语法 索引库操作 mapping属性 创建索引库 字段拷贝 查询、删除、修改索引库 文档操作 新增文档 查询、删除文档 修改文档 全量修改 增量修改 DSL文档语法小结 Rest…

Mac配置Python3最简单的方法

此文介绍Mac用Anaconda配置Python3 达成效果 能让你目前只装有Python2的Mac装上Python3,同时拥有很多科学计算库 anaconda介绍 anaconda 是一个python的发行版,包括了python和很多常见的软件库, 和一个包管理器conda。常见的科学计算类的库都包含在里…

美国突然致敬中本聪

作者:秦晋 有点看不懂美国的神操作。 2月16日,据《Bitcoin Magazine》报道,比特币的竞争对手、美国参议员伊丽莎白-沃伦对比特币的立场突然180度大转弯。由反对立场转为支持立场。让很多行业媒体出乎意料,甚至惊掉下巴。 报道称&a…

【测试】JUnit

目 录 一.注解二.断言三.用例的执行顺序四.参数化五.测试套件 自动化就是 selenium 脚本来实现的 junit 是 java 的单亓测试工具&#xff0c;只不过我们在实现自动化的时候需要借用一下下 junit 库里面提供的一些方法 引入依赖 Junit 5 <!-- https://mvnrepository.com/a…

php 数组函数

php 数组函数 1. 常用的php数组函数 1. 常用的php数组函数 array_pop() 删除数组中最后一个元素 array_push() 将一个或多个元素插入到数组的末尾 array_keys <?php $arr array("刘岩" > 30, "范冰冰" > 31, "娜扎" > 31);$…

DS:八大排序之堆排序、冒泡排序、快速排序

创作不易&#xff0c;友友们给个三连吧&#xff01;&#xff01; 一、堆排序 堆排序已经在博主关于堆的实现过程中详细的讲过了&#xff0c;大家可以直接去看&#xff0c;很详细,这边不介绍了 DS&#xff1a;二叉树的顺序结构及堆的实现-CSDN博客 直接上代码&#xff1a; …

备战蓝桥杯---图论之最小生成树

首先&#xff0c;什么是最小生成树&#xff1f; 他就是无向图G中的所有生成树中树枝权值总和最小的。 如何求&#xff1f; 我们不妨采用以下的贪心策略&#xff1a; Prim算法&#xff08;复杂度&#xff1a;&#xff08;nm)logm)&#xff1a; 我们对于把上述的点看成两个集…

MAC VSCODE g++编译器无法编译C++11语法的 解决办法(CodeRunner版本)

如果你是使用的 codeRunner 这个插件&#xff0c;就是这个按钮 coderunner的原理大致是&#xff1a;先判断你这是什么语言&#xff0c;然后有一个 code-runner.executorMap 来对应各个语言是用什么执行语句 我发现&#xff0c;我修改之前&#xff08;无法执行C11语法的原因是&a…

智能汽车专题:智能驾驶2023年度报告

今天分享的是智能汽车系列深度研究报告&#xff1a;《智能汽车专题&#xff1a;智能驾驶2023年度报告》。 &#xff08;报告出品方&#xff1a;量子位智库&#xff09; 报告共计&#xff1a;30页 来源&#xff1a;人工智能学派 顶天立地&#xff1a;技术进阶路线明晰 根据…

echarts制作两个柱状图

let colorList[#02ce8b,#ffbe62,#f17373]; let data1 [90,80,70,50] option { title:[{ // 第一个标题text: 环保检测, // 主标题textStyle: { // 主标题样式color: #333,fontWeight: bold,fontSize: 16},left: 20%, // 定位到适合的位置top: 10%, // 定位到适合的位置},{ //…

小程序获取手机号:快速验证和实时验证

概述 小程序手机号快速验证和实时验证都已经开始收费了。 手机号实时验证组件&#xff0c;在每次请求时&#xff0c;平台均会对用户选择的手机号进行实时验证&#xff1b;每次组件调用成功&#xff0c;收费0.04元手机号快速验证组件&#xff0c;平台会对号码进行验证&#xf…

论文阅读_语音识别_Wisper

英文名称: Robust Speech Recognition via Large-Scale Weak Supervision 中文名称: 通过大规模弱监督实现鲁棒语音识别 链接: https://proceedings.mlr.press/v202/radford23a.html 代码: https://github.com/openai/whisper 作者: Alec Radford, Jong Wook Kim, Tao Xu, Greg…

基于协同过滤的时尚穿搭推荐系统

项目&#xff1a;基于协同过滤的时尚穿搭推荐系统 摘 要 基于协同过滤的时尚穿搭推荐系统是一种能自动从网络上收集信息的工具&#xff0c;可根据用户的需求定向采集特定数据信息的工具&#xff0c;本项目通过研究服饰流行的分析和预测的分析和预测信息可视化时尚穿搭推荐系统…

2024免费人像摄影后期处理工具Portraiture4.1

Portraiture作为一款智能磨皮插件&#xff0c;确实为Photoshop和Lightroom用户带来了极大的便利。通过其先进的人工智能算法&#xff0c;它能够自动识别并处理照片中的人物皮肤、头发和眉毛等部位&#xff0c;实现一键式的磨皮美化效果&#xff0c;极大地简化了后期处理的过程。…

STM32下载后需要复位

下载后需要复位才能自动运行程序&#xff0c;需要以下两步 STEP1 STEP2 一个勾选&#xff0c;一个不勾选。

乡政府|乡政府管理系统|基于Springboot的乡政府管理系统设计与实现(源码+数据库+文档)

乡政府管理系统目录 目录 基于Springboot的乡政府管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、用户信息管理 2、活动信息管理 3、新闻类型管理 4、新闻动态管理 四、数据库设计 1、实体ER图 五、核心代码 六、论文参考 七、最新计算机毕设选题推…

内存块与内存池

&#xff08;1&#xff09;在运行过程中&#xff0c;MemoryPool内存池可能会有多个用来满足内存申请请求的内存块&#xff0c;这些内存块是从进程堆中开辟的一个较大的连续内存区域&#xff0c;它由一个MemoryBlock结构体和多个可供分配的内存单元组成&#xff0c;所有内存块组…

JAVA之Java线程核心详解

Java线程核心 1.进程和线程 进程&#xff1a;进程的本质是一个正在执行的程序&#xff0c;程序运行时系统会创建一个进程&#xff0c;并且给每个进程分配独立的内存地址空间保证每个进程地址不会相互干扰。同时&#xff0c;在 CPU 对进程做时间片的切换时&#xff0c;保证进程…

Java 抽象容器类源码剖析

总体介绍 抽象容器类接口和具体容器类的关系如图所示&#xff0c;顶层包括Collection、List、Set、Queue、Deque和Map6个抽象容器类。 AbstractCollection&#xff1a;实现了Collection接口&#xff0c;被抽象类AbstractList、AbstractSet、AbstractQueue继承&#xff0c;Arra…

飞天使-k8s知识点19-kubernetes实操4-资源调度 标签和选择器:Label与Selector的使用-版本回退

文章目录 添加label资源调度 Deployment&#xff1a;创建与配置文件解析rs pod deploy 的关联信息展示Deployment&#xff1a;滚动更新Deployment&#xff1a;回滚回退版本实际操作 添加label [rootkubeadm-master1 test]# kubectl get pod NAME …