学习人工智能:吴恩达《AI for everyone》2019 第3周:实现智能音箱和自动驾驶的几个步骤;无监督学习;增强学习

news2025/1/11 14:50:17

  吴恩达 Andrew Ng, 斯坦福大学前教授,Google Brain项目发起人、领导者。

Coursera 的联合创始人和联合主席,在 Coursera 上有十万用户的《机器学习》课程;斯坦福大学计算机科学前教授。百度前副总裁、前首席科学家;谷歌最成功的人工智能项目之一——Google Brain的发起人、领导者。

参考链接: AI for everyone

智能音响的4个步骤

四个步骤, 第一个步骤是检测触发词, 第二个是语音识别, 然后是意图识别, 最后用户对智能音响指令的执行 像这样的由 几个步骤组成的人工智能系统 有时,被称为人工智能管道 就是说,你有好几个人工智能组件 或是好几个机器学习组件, 来一步一步地 处理数据 一个公司里由四个不同的团队, 来专注于这个人工智能管道中的每一个步骤 是很常见的!

自动驾驶汽车,将多个人工智能组件组装在一起

主要步骤

汽车会接收各种各样的传感器作为输入 比如汽车前方 侧面或后方的图片 以及声波雷达 或激光雷达的传感器读数 有了这些作为输入 就能探测出其他车辆的存在或所在位置, 这样的话,你就可以 发现附近有车 同时注意到行人的位置 因为我们想要避开 其他车辆以及行人 汽车探测和行人探测 都可以通过机器学习来完成,即 使用输入输出映射,或A到B映射 这里的输入可能是图片 或者是雷达和激光雷达信息 输出是 其他车辆和行人的位置

最终,既然你已经知道了 其他车辆和其他行人的位置 你可以将这些信息投喂到 另一个专用的软件里, 这个软件称作运动规划, 这个软件的会规划动作 或者帮你规划 你的车行驶的路径 这样你就可以靠近你的目的地了 并且同时避免碰撞 一旦你规划出了你的车的动作 你可以将其转化成 特别的舵机角度 和加速度以及刹车指令 像油门应该踩多少 刹车应该踩多少来使你的车 以预想的角度和速度移动。


 

运动规划

简要介绍一下运动规划步骤 下面是一个例子, 比如你在开车 你的前方有一辆淡蓝色的车 运动规划软件的工作是 告诉你你的行车路径应该是什么 如这里红色部分所示 你应该沿着这个路径驾驶 从而不发生事故 所以运动规划软件的工作是 输出你驾驶的路径 以及速度 为了沿着道路行驶 和应该被设定的速度 所以你不会撞上另一辆车 同时还以合理的速度在路上行驶着 来看另一个例子 如果有一辆灰色的汽车 停在路的右边, 然后你想超过这辆车, 那么运动规划软件的工作是 画出一个像这样的路径 来使你向左开一些, 安全地超过这辆车 到目前为止,我简单描述了自动驾驶 主要的三个组成部分。

在一个真实的自动驾驶汽车里,更多组件

在一个真实的自动驾驶汽车里, 你通常不仅仅只使用 摄像头、雷达和激光雷达, 现在大多数自动驾驶汽车还会使用GPS 来获得位置,还有加速度计 有时候称作IMU,这就是加速度计 陀螺仪还有地图 因为我们知道 汽车通常更多是在道路上被发现 而行人更可能在人行道上被发现 尽管有时候他们也会出现在公路上, 所有这些都是 附加的信息,用以检测 车辆和行人 和接下来我们即将提到的别的物体。

除了检测车辆或者行人 为了安全驾驶你还需要知道 这些车和行人接下来要去哪儿 所以,另一个普遍的 自动驾驶汽车的部分是轨迹预测 这是另一个人工智能的部分, 它不仅让你找到车辆和行人 还有他们可能 在接下来的几秒钟到哪儿去 所以就算他们正在移动,你也可以避开他们。

安全驾驶不仅需要 知道其他车辆和行人的位置, 你还需要知道车道, 所以你还需要探测车道标志, 如果有交通灯你还需要 找到交通灯在哪儿 以及它是红灯、 黄灯还是绿灯 有时候还有其他障碍物 如突然出现的交通锥体,或者 也会有一群鹅从你的车前经过 这也需要被检测 所以你的车可以躲避 除了车辆和行人之外的其他障碍物

在一个大的自动驾驶汽车设计团队里, 让一部分人分别 负责每一个 这些红色的方框里的工作 一点都不例外。因为只有把他们分别做好, 然后组合放在一起,才能够 设计一辆自动驾驶汽车 如你在这些 综合的人工智能例子里, 以及之前的例子里 -- 比如智能音响--里 所看到的四步AI途径, 有时这需要一整个队伍才能构建 出一个复杂的AI产品。 

 非监督式学习

监督式学习(学习从输出A到输出B的映射) 在现今环境下是最有价值的技术,最典型的例子就是人脸识别,我们把人脸A和身份信息B,一起告诉AI,AI自己找出A到B的映射关系。

在非监督式学习里最著名的是聚类

聚类算法以这样的方式分析数据,自动地将数据分成 两个群体,或者更多群体,它通常用于分析市场分层 ,算法会帮助你挖掘市场特点。

聚类被称为非监督式算法,相比 监督学习算法是寻找A(输入) 到 B(输出) 映射模式, 你必须告诉算法你需要的输出B是什么, 非监督学习算法并不需要准确地告诉 AI 系统要什么输出 你只需给 AI 系统提供了一堆数据, 如:客户数据, 并告诉AI在里面找到一些有趣的信息, 有意义的结论就行。

强化学习

强化学习和训练 宠物狗的行为类似。  如何训练狗呢? 我们先让狗做任何它想做的事, 每当它表现得很好的时候,我们就会表扬它,称它好狗;  每当它做坏事的时候, 叫它坏狗bad dog 这样它就逐渐学会了好的行为, 而害怕不好的行为。 强化学习采用同样的原则, 用于直升机或其他事情。 

使用强化学习, 我们研发了世界上最棒的自主飞行直升机, 除了自动机器人, 强化学习 在玩游戏, 或者黑白棋、跳棋、国际象棋、围棋方面也应用很多。 你也许听说过AlphaGo, 通过强化学习它非常擅长玩围棋。

生成对抗网络

生成对抗网络 -- 另一种令人兴奋的AI技术-- 它是我的学生伊恩·古德费罗创造的, 生成对抗网络非常擅长于在什么都没有的情况下合成全新的图像。通过从名人图像数据库进行学习之后, 这个算法能够合成全新的图片。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1499097.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【深度优先】【图论】【C++算法】2045. 到达目的地的第二短时间

作者推荐 视频算法专题 LeetCode2045. 到达目的地的第二短时间 城市用一个 双向连通 图表示,图中有 n 个节点,从 1 到 n 编号(包含 1 和 n)。图中的边用一个二维整数数组 edges 表示,其中每个 edges[i] [ui, vi] 表…

开源分子对接程序rDock使用方法(1)-Docking in 3 steps

欢迎浏览我的CSND博客! Blockbuater_drug …点击进入 文章目录 前言一、Docking in 3 steps 标准对接rDock 的基本对接步骤及注意事项 二、 三步对接案例Step 1. 结构文件准备Step 2. 产生对接位点Step 3. 运行分子对接3.1 检查输入文件3.2 测试-只进行打分3.3 运行…

Linux/Validation

Enumeration nmap 第一次扫描发现系统对外开放了22,80,4566和8080端口,端口详细信息如下 系统对外开放了4个端口,从nmap的结果来看,8080无法访问,手动尝试后4566也无法访问,只能从80端口开始 …

用MATLAB求解微分方程

第一篇为 基础概念 ,第二篇为 R-K法的具体实现方法。 (一)常微分方程的MATLAB求解 概要: 常微分方程的MATLAB求解分为解析解、数值解解析解(只有少数微分方程组有解析解):dsolve函数数值解:solver函数&a…

Python实例☞数据类型及运算符案例

实例一: ❶要求☞从键盘获取一个4位整数,并分别输出个、十、百、千位 ❷程序代码☞ ①第一种方法 print(请输入一个4位整数:) xeval(input()) print(个位数为:,x%10) print(十位数为:,(x//10)%10) print(百位数为&am…

Transformer中的FeedForward

Transformer中的FeedForward flyfish class PoswiseFeedForwardNet(nn.Module):def __init__(self, d_ff2048):super(PoswiseFeedForwardNet, self).__init__()# 定义一维卷积层 1,用于将输入映射到更高维度self.conv1 nn.Conv1d(in_channelsd_embedding, out_ch…

自律篇001-养成自律的秘密武器1-目标规划表

🚀以前在某书上看到一些博主非常自律,比如每天5点多起床看书,或者每天坚持健身,直到练出马甲线,还有一边工作一边考研等等,自己也曾尝试过做一些目标规划,但结果都不尽人意。写计划的时候往往信…

EVE-NG桥接虚拟网卡实现与虚拟机通讯

一、知识补充 1、VMware网络连接 在VM中,给我们提供了以下几种连接网络的模式 桥接模式:直接联机物理网络NAT模式:用于共享主机的IP地址仅主机模式:与主机共享的专用网络自定义:特定虚拟网络LAN区段 特别注意的是&am…

c++ 11 新特性 元组

一.元组介绍 C11引入了元组(tuple)这一新特性,它是一种可以存储不同类型元素的复合类型。元组类似于结构体,但更加灵活,因为它可以在运行时动态地创建和访问元素。 二.元组使用场景 C11中引入的元组(tuple&…

css clip-path polygon属性实现直角梯形

2024.3.8今天我学习了如何用css实现直角梯形的效果, 效果: 具体实现原理: 一、需要三个div: 外面一个大的div,里面左右两个小的div 我们需要先把第一个div变成直角梯形: 大概是这样,设置好之…

ORA/GSA -- 学习记录

brief over-representation analysis(ORA),过表“达”分析,就是我们做多分组的RNAseq数据解析后会得到一些差异表达的gene,有些时候是单独拿出一个差异gene去解释表型,缺点是欠缺证据力度。有些人就把一些相关的差异gene放在一块儿解释&…

Extend继承

继承的作用 当我们定义了一个Person类: class Person{private Stirng name;private int age;public String getName(){....}public int getAge(){...}public void setName(String name){...}public void setAge(int age){...} }现在,假设还需要定义一个…

最小二乘法(带你 原理 实践)

文章目录 引言一、最小二乘法的基本原理二、最小二乘法的计算过程建立模型确定目标函数求解模型参数模型检验 三、最小二乘法的优缺点优点原理简单易懂统计特性优良适用范围广泛 缺点对异常值敏感假设条件较多 四、最小二乘法在实际应用中的案例五、如何克服最小二乘法的局限性…

OPCUA 学习笔记:程序模型

无论是边缘控制器,还是PLC 中,除了信息模型之外,还有应用程序,这些程序可能是IEC61131-3 编写的程序,也可能是其它程序开发的可执行程序。 尽管OPCUA 描述模型能力很强,但是它缺乏算法的描述方式。但是OPCU…

在k8s上部署dolphinscheduler

(作者:陈玓玏) 一、 前提条件 已部署k8s,版本信息如下: k8s为单机部署;已部署nfs,版本如下; 二、 部署helm 以下步骤安装的是二进制版本,如果通过脚本安装&#…

【AI视野·今日Sound 声学论文速览 第五十四期】Thu, 7 Mar 2024

AI视野今日CS.Sound 声学论文速览 Thu, 7 Mar 2024 Totally 8 papers 👉上期速览✈更多精彩请移步主页 Daily Sound Papers Can Audio Reveal Music Performance Difficulty? Insights from the Piano Syllabus Dataset Authors Pedro Ramoneda, Minhee Lee, Dasa…

学生信息管理APP

设计内容简介 本次设计使用Android Studio实现一个学生信息管理系统,系统功能结构如下图所示: 详细设计 数据库设计SQLite,是一款轻型的数据库,是遵守ACID的关联式数据库管理系统,它的设计目标是嵌入式的,而且目前已经在很多嵌入式产品中使用了它,它占用资源非常的低。…

Android14音频进阶:AudioTrack与AudioFlinger创建数据通道(五十八)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒体系统工程师系列【原创干货持续更新中……】🚀 人生格言: 人生从来没有捷径,只…

UNIAPP微信小程序中使用Base64编解码原理分析和算法实现

为何要加上UNIAPP及微信小程序,可能是想让检索的翻围更广把。😇 Base64的JS原生编解码在uni的JS引擎中并不能直接使用,因此需要手写一个原生的Base64编解码器。正好项目中遇到此问题,需要通过URLLink进行小程序跳转并携带Base64参…

定时执行专家V7.1 多国语言版本英文版发布 - TimingExecutor V7.1 English Version Release

目录 ◆ About TimingExecutor ◆ Main Frame ◆ Job Dailog ◆ Trigger Dialog ◆ Setting Dialog ◆ About Dialog ◆ Job Detail Information panel ◆ Statistics Information panel ◆ About TimingExecutor 《定时执行专家》是一款制作精良、功能强大、毫秒精度…