读人工智能全传10深度思维

news2024/11/16 0:02:19

1. 深度思维

1.1. DeepMind

1.1.1. 深度思维

1.1.2. 2014年的员工不足25人

1.1.3. 深度思维公司公开宣称其任务是解决智能问题

1.1.4. 2014年谷歌收购DeepMind,人工智能突然成了新闻热点,以及商业热点

1.1.4.1. 收购报价高达4亿英镑
1.1.4.2. 深度思维是人工智能领域最引人注目的收购

1.2. 科技公司都争先恐后投入这个领域,生怕被历史车轮甩落

1.2.1. 2015年,优步公司从卡内基-梅隆大学机器学习实验室揽获了至少40名研究人员

1.3. 雅达利游戏系统

1.3.1. 基于早期的雅达利2600系列游戏机

1.3.2. 1980年前后的产品

1.3.3. 最早获得成功的视频电子游戏平台之一

1.3.4. 它支持210×160像素网格的大分辨率视频,支持128位颜色

1.3.5. 用户通过一个带单独按钮的操作杆进行操作,游戏机使用插卡式游戏卡带

1.3.6. 深度思维用的游戏卡带一共有49个游戏

1.4. 深度思维的程序根本没有任何关于游戏的知识,程序得到的唯一信息是出现在游戏机屏幕上的图像(以210×160彩色像素网格的形式)和游戏的当前分数

1.4.1. 程序没有得到诸如“对象A在位置(x, y)上”之类的信息

1.4.2. 任何类似的信息都需要程序从原始的视频数据中自己提取

1.4.3. 程序通过强化学习自学玩游戏:反复玩同一个游戏,在每个游戏中进行实验并获得反馈,并学习哪些行为会得到奖励,而哪些不会

1.4.4. 雅达利游戏程序学会了游戏卡带中的29个游戏,表现出高于人类玩家平均水准的能力

1.4.4.1. 在某些游戏里面,它甚至达到了超人的水准

1.5. 他们所做的是写一个程序,让它学习如何比人类更会玩全部49个雅达利游戏中的29个

1.5.1. 程序接收到的唯一输入就是屏上显示的东西,以及分数

1.6. 玩打砖块游戏

1.6.1. 程序了解到,最有效率得高分的方式是在砖墙的一侧“钻”一个洞,让球打进去,这样球就会在砖墙和顶部屏障之间快速反弹,迅速消灭砖块,而玩家可以不用额外操作什么

1.6.1.1. 它是由程序自主学习的

1.7. 蒙特祖玛的复仇

1.7.1. 程序玩得特别糟糕的游戏

1.7.2. 它的难点在于奖励非常稀少

1.7.3. 玩家在获得奖励之前必须执行一系列复杂的任务

1.7.3.1. 这一点与打砖块这种游戏不同,在打砖块游戏中奖励反馈或多或少都是即时的
1.7.3.2. 如果奖励反馈在相关行动执行后很长时间才出现,就会给强化学习带来困难
1.7.3.2.1. 你可能不清楚是哪些行为导致了奖励的发生

1.8. 如果雅达利游戏程序是深度思维团队唯一完成的东西,那也足够让他们在人工智能的历史上留下令人尊重、浓墨重彩的一笔,但是,该团队随后又取得了一系列惊人的成就

1.8.1. 深度思维的工作,从他们的雅达利游戏机到AlphaZero,代表了人工智能领域一系列非凡的突破性成就

2. AlphaGo

2.1. 可能仍然是迄今为止最著名的人工智能系统

2.2. 使用了两个神经网络

2.2.1. 价值网络只负责评估给定的棋盘位置的优劣程度

2.2.2. 策略网络则根据当前棋盘的状况评估下一步棋该放在何处

2.3. 策略网络包含13层,首先使用监督式学习进行训练,训练的数据则是人类的专业棋手下棋的棋谱

2.4. 然后进行自我对战的强化学习

2.5. 最后,这两个网络被嵌入一个复杂的蒙特卡罗树这一搜索技术中

2.6. 撇开表象深入挖掘,你会发现AlphaGo中最能体现智慧的工程都源自经典的人工智能搜索

2.6.1. 于20世纪50年代开发了跳棋学习程序的亚瑟·塞缪尔,他在理解AlphaGo使用的搜索技术时不会有任何困难

2.6.2. 从他的跳棋程序,到现代最引人注目的人工智能系统,都遵循着同一条发展路径

2.7. AlphaGo尽管在围棋方面表现优秀,但它只能下围棋,还必须事先学习许多人类专业棋手的棋谱

3. AlphaGo Zero

3.1. 它的非凡之处在于它是从零开始学习下围棋的,没有学习任何人类棋手的棋谱

3.2. 在没有人工数据干预的情况下,它达到了超越人类棋手的水平,而这一切,只是通过它自己和自己下围棋来实现的

3.3. 在结束9个小时的自我学习以后,AlphaZero能够在和鳕鱼系统对战中连续击败对方,最少也能保持平局

3.3.1. 鳕鱼系统是世界领先的国际象棋程序之一

3.4. AlphaZero似乎可以自学成才,并且适用于多种不同类型的棋类游戏

3.5. 结论

3.5.1. 尽管AlphaZero体现了令人印象深刻的通用性(它在棋类游戏专业的通用性方面超过了此前任何一个人工智能系统),但它本身并不代表迈向通用人工智能的重大进步

3.5.2. 棋类游戏是相当抽象的,它们与现实世界相去甚远

4. 图像标注

4.1. 你对这幅图的理解是基于你在这个世界上作为一个人类存在的经历

4.2. 这样的理解对于标注机器人而言是不可能实现的,因为它没有这个基础

5. 自动翻译

5.1. 将一种语言自动翻译成另一种语言,是过去十年中因为深度学习技术而快速进步的另一个领域

5.2. 自动翻译工具能做到什么,又不能做到什么,有助于我们理解深度学习的局限性

5.3. 谷歌翻译可能算是最著名的自动翻译系统了

5.4. 关键就在于,你仅仅是懂得法语并不代表就能做好普鲁斯特小说的翻译

5.4.1. 关于20世纪初期法国社会和法国人生活的知识

5.4.1.1. 你得知道他们使用蜡烛照明

5.4.2. 法国历史的知识

5.4.2.1. 你得知道弗朗索瓦一世和查理五世之间的斗争史

5.4.3. 20世纪早期法国文学常识

5.4.3.1. 当时的写作风格,还有作者可能引用的典故

5.4.4. 对普鲁斯特本人的了解

5.4.4.1. 他最想表达的是什么

5.4.5. 需要你有大量的背景知识,谷歌翻译所使用的神经网络里可没有这些知识

5.5. 我们必须消除明确表示知识的世界和深度学习以及神经网络的世界之间的隔阂

6. 学界

6.1. 机器学习领域的两件学界大事是神经信息处理系统(NeurIPS)会议和国际机器学习会议(ICML)

6.2. 机器学习研究领域的许多人根本就不把自己视为“人工智能”的一部分

6.3. 不管分裂的起源是什么,事实就是,在某种程度上,机器学习研究领域的许多人脱离了主流人工智能,沿着自己的轨迹发展

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1920397.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

差分约束——AcWing 362. 区间

差分约束 定义 差分约束系统是一种在计算机科学和运筹学中用于解决特定类型优化问题的工具。它主要用于处理一类线性不等式组,这些不等式描述了变量之间的相对大小关系,而不是直接的绝对值大小。差分约束系统通常用于路径寻找、调度、资源分配等问题。…

maven私有镜像仓库nexus部署使用

maven私有镜像仓库nexus部署使用 1、Nexus部署 #查找镜像 docker search sonatype/nexus3 #拉取镜像 docker pull sonatype/nexus3 #持久化目录 mkdir -p /data/nexus/data chmod 777 -R /data/nexus/data #启动服务 docker run -d --name nexus3 -p 8081:8081 --restart alw…

javaweb基础知识入门

javaweb 1.基本概念 1.1前言 web开发: web,网页的意思,www.baidu.com 静态web html,css 提供给所有人看的数据始终不会发生变化! 动态web 淘宝...等几乎是所有的网站 提供给所有人看的数据始终会发生变化&#…

mac生成.dmg压缩镜像文件

mac生成.dmg压缩镜像文件 背景准备内容步骤1,找一个文件夹2,制作application替身1,终端方式2,黄金右手方式 3,.app文件放入文件夹4,制作.dmg压缩镜像文件5,安装.dmg 总结 背景 为绕开App Store…

头歌资源库(27)特别的数

一、 问题描述 编程输出一个特别的数,该数是一个由1~9组成的9位数,每个数字只能出现一次,且这个9位数由高位到低位前i位能被i整除。 二、算法思想 创建一个长度为9的数组,用于存放1~9这9个数字。使用回溯算法,从第…

Visual Studio 2019 (VS2019) 中使用 CMake 配置 OpenCV 库(快捷版)

2024.07.11 测试有效 最近需要用一下 opencv 处理图像,简单配置了一下Cmake下的 opencv 库。 没有编译 opencv ,也不知道他们为什么要自己编译 opencv 。 一、下载并安装 OpenCV 1.前往 OpenCV 官方网站 下载适用于您的系统的 OpenCV 安装包。 2.点击直接…

在分布式环境中,怎样保证 PostgreSQL 数据的一致性和完整性?

文章目录 在分布式环境中保证 PostgreSQL 数据的一致性和完整性一、数据一致性和完整性的重要性二、分布式环境对数据一致性和完整性的挑战(一)网络延迟和故障(二)并发操作(三)数据分区和复制 三、保证 Pos…

PFH点特征直方图

PFH特征描述子原理 该算法通过参数化查询关键点与其周围邻域点之间的空间差异,形成一个多维度直方图,从而实现对该点的邻域几何属性的描述。 该方法具有以下三个优势: (1)刚性变换不变性,即不受旋转、平移变换的影响; (2)采样一致性,即改变采样密度,特征保…

【高中数学/指数函数、对数函数、正弦函数】求 y=2^x+x,y=log2_x+x,y=2*sinX+x 的零点位置大小关系

【问题】 已知函数f(x)2^xx,g(x)log2_xx,h(x)2*sinXx 的零点分别是a,b,c,则a、b、c的大小顺序是? 【解答】 粗览三个函数,h(x)2*sinXx的零点是最好解决的,明显x0时h(x)0,因此c在原点的位置; 对于f(x)2^xx&#xff…

css预编译器--sass

Sass Sass 提供了 变量(variables)、嵌套规则(nested rules)、 混合(mixins)、 函数(functions),目前我使用最多的还是变量和嵌套规则,貌似目前css也支持嵌套…

kafka发送消息流程

配置props.put(ProducerConfig.PARTITIONER_CLASS_CONFIG, RoundRobinPartitioner.class); public Map<String,Object> producerConfigs(){Map<String,Object> props new HashMap<>();props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,bootstrapServers…

代码随想录算法训练营Day36||动态规划part04

494.目标和&#xff1a;本题的方法主要用来解决------装满容量为x的背包&#xff0c;有几种方法。 可以先理解二维数组的思路&#xff1a;感觉b站一个评论写得很清晰&#xff0c;借用一下。 这题最难理解的地方在于如何初始化数组&#xff0c;为什么dp[0]1&#xff1b;我试图自…

【C++BFS】690. 员工的重要性

本文涉及知识点 CBFS算法 LeetCode690. 员工的重要性 你有一个保存员工信息的数据结构&#xff0c;它包含了员工唯一的 id &#xff0c;重要度和直系下属的 id 。 给定一个员工数组 employees&#xff0c;其中&#xff1a; employees[i].id 是第 i 个员工的 ID。 employees[…

企业数据治理做完了,如何让业务部门用起来

引言&#xff1a;企业数据治理完成后&#xff0c;确保业务部门能够充分利用这些数据并融入日常运营中&#xff0c;是实现数据价值最大化的关键步骤。以下是一些策略和建议&#xff0c;帮助推动业务部门使用数据治理成果&#xff1a; 一、管理层面推广 高层应用示范&#xff1…

kafka与zookeeper的SSL认证教程

作者 乐维社区&#xff08;forum.lwops.cn&#xff09;许远 在构建现代的分布式系统时&#xff0c;确保数据传输的安全性至关重要。Apache Kafka 和 Zookeeper 作为流行的分布式消息队列和协调服务&#xff0c;提供了SSL&#xff08;Secure Sockets Layer&#xff09;认证机制&…

在 PostgreSQL 里如何实现数据的缓存失效策略的优化?

文章目录 《在 PostgreSQL 中优化数据缓存失效策略》一、理解 PostgreSQL 中的数据缓存二、常见的数据缓存失效策略三、优化数据缓存失效策略的方法&#xff08;一&#xff09;合理调整共享缓冲区大小&#xff08;二&#xff09;使用 PostgreSQL 的缓存统计信息&#xff08;三&…

SSE(Server-Send-Event)服务端推送数据技术

SSE&#xff08;Server-Send-Event&#xff09;服务端推送数据技术 大家是否遇到过服务端需要主动传输数据到客户端的情况&#xff0c;目前有三种解决方案。 客户端轮询更新数据。服务端与客户端建立 Socket 连接双向通信服务端与客户建立 SSE 连接单向通信 几种方案的比较&…

实变函数精解【3】

文章目录 点集求导集 闭集参考文献 点集 求导集 例1 E { 1 / n 1 / m : n , m ∈ N } 1. lim ⁡ n → ∞ ( 1 / n 1 / m ) 1 / m 2. lim ⁡ n , m → ∞ ( 1 / n 1 / m ) 0 3. E ′ { 0 , 1 , 1 / 2 , 1 / 3 , . . . . } E\{1/n1/m:n,m \in N\} \\1.\lim_{n \rightar…

Spark SQL 概述

Spark SQL 概述 Spark SQL 是 Apache Spark 的一个模块&#xff0c;专门用于处理结构化数据。它集成了 SQL 查询和 Spark 编程的强大功能&#xff0c;使得处理大数据变得更加高效和简便。通过 Spark SQL&#xff0c;用户可以直接在 Spark 中使用 SQL 查询&#xff0c;或者使用 …

i18n、L10n、G11N 和 T9N 的含义

注&#xff1a;机翻&#xff0c;未校对。 Looking into localization for the first time can be terrifying, if only due to all of the abbreviations. But the meaning of i18n, L10n, G11N, and T9N, are all very easy to understand. 第一次研究本地化可能会很可怕&…