sheng的学习笔记-【中】【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第二周测验

news2024/9/27 21:29:55

课程3_第2周_测验题

目录:目录

要解决的问题

① 为了帮助你练习机器学习的策略,本周我们将介绍另一个场景,并询问你将如何行动。

② 我们认为这个在机器学习项目中工作的“模拟器”将给出一个任务,即领导一个机器学习项目可能是什么样的!

③ 您受雇于一家初创公司,制造自动驾驶汽车。

④ 您负责检测图像中的道路标志(停车标志、人行横道标志、施工先行标志)和交通信号(红绿灯)。

⑤ 目标是识别每张图像中的这些对象。例如,上面的图像包含人行横道标志和红色交通灯。

在这里插入图片描述

第一题

① 您的100,000张带标签的图片是使用您汽车的前置摄像头拍摄的,这也是你最关心的数据分布,您认为您可以从互联网上获得更大的数据集,即使互联网数据的分布不相同,这也可能对训练有所帮助。你刚刚开始着手这个项目,你做的第一件事是什么?假设下面的每个步骤将花费大约相等的时间(大约几天)。

A. 【  】花几天时间去获取互联网的数据,这样你就能更好地了解哪些数据是可用的。

B. 【  】花几天的时间检查这些任务的人类表现,以便能够得到贝叶斯误差的准确估计。

C. 【  】花几天的时间使用汽车前置摄像头采集更多数据,以更好地了解每单位时间可收集多少数据。

D. 【  】花几天时间训练一个基本模型,看看它会犯什么错误。

答案:

D.【 √ 】花几天时间训练一个基本模型,看看它会犯什么错误。

第二题

① 您的目标是检测道路标志(停车标志、行人过路标志、前方施工标志)和交通信号(红灯和绿灯)的图片,目标是识别这些图片中的哪一个标志出现在每个图片中。 您计划在隐藏层中使用带有ReLU单位的深层神经网络。

② 对于输出层,使用Softmax激活将是输出层的一个比较好的选择,因为这是一个多任务学习问题,对吗?

A. 【  】对

B. 【  】不对

答案:

B.【 √ 】不对

第三题

① 你正在做误差分析并计算错误率,在这些数据集中,你认为你应该手动仔细地检查哪些图片(每张图片都做检查)?

A. 【  】随机选择10,000图片

B. 【  】随机选择500图片

C. 【  】500张算法分类错误的图片

D. 【  】10,000张算法分类错误的图片

答案:

C.【 √ 】500张算法分类错误的图片

第四题

① 在处理了数据几周后,你的团队得到以下数据:

  • 100,000 张使用汽车前摄像头拍摄的标记了的图片。
  • 900,000 张从互联网下载的标记了道路的图片。

② 每张图片的标签都精确地表示任何的特定路标和交通信号的组合。

③ 例如 y ( i ) y^{(i)} y(i)表示图片包含了停车标志和红色交通信号灯。

y ( i ) = [ 1 0 0 1 0 ] y^{(i)}=\begin{bmatrix} 1\\ 0\\ 0\\ 1\\ 0 \end{bmatrix} y(i)= 10010

④ 因为这是一个多任务学习问题,你需要让所有 y ( i ) y^{(i)} y(i)向量被完全标记。 如果一个样本等于

[ 1 ? 0 1 ? ] \begin{bmatrix} 1\\ ?\\ 0\\ 1\\ ? \end{bmatrix} 1?01?

⑤ 那么学习算法将无法使用该样本,是正确的吗?

A. 【  】对

B. 【  】不对

答案:

B.【 √ 】不对

第五题

5.你所关心的数据的分布包含了你汽车的前置摄像头的图片,这与你在网上找到并下载的图片不同。如何将数据集分割为训练/验证/测试集?

A. 【  】将10万张前摄像头的图片与在网上找到的90万张图片随机混合,使得所有数据都随机分布。 将有100万张图片的数据集分割为:有60万张图片的训练集、有20万张图片的验证集和有20万张图片的测试集。

B. 【  】将10万张前摄像头的图片与在网上找到的90万张图片随机混合,使得所有数据都随机分布。将有100万张图片的数据集分割为:有98万张图片的训练集、有1万张图片的验证集和有1万张图片的测试集。

C. 【  】选择从互联网上的90万张图片和汽车前置摄像头的8万张图片作为训练集,剩余的2万张图片在验证集和测试集中平均分配。

D. 【  】选择从互联网上的90万张图片和汽车前置摄像头的2万张图片作为训练集,剩余的8万张图片在验证集和测试集中平均分配。

答案:

C.【 √ 】选择从互联网上的90万张图片和汽车前置摄像头的8万张图片作为训练集,剩余的2万张图片在验证集和测试集中平均分配。

第六题

6.假设您最终选择了以下拆分数据集的方式:

在这里插入图片描述

① 您还知道道路标志和交通信号分类的人为错误率大约为0.5%。以下哪项是对的?(选出所有正确项)

A. 【  】由于开发集(验证集)和测试集的错误率非常接近,所以你过拟合了开发集(验证集)。

B. 【  】你有很大的数据不匹配问题,因为你的模型在训练-开发集(训练-验证集)上比在开发集(验证集)上做得好得多。

C. 【  】你有很大的可避免偏差问题,因为你的训练集上的错误率比人为错误率高很多。

D. 【  】你有很大的方差问题,因为你的训练集上的错误率比人为错误率要高得多。

E. 【  】你有很大的方差问题,因为你的模型不能很好地适应它从来没有见过,但是来自训练集同一分布的数据

答案:

B.【 √ 】你有很大的数据不匹配问题,因为你的模型在训练-开发集(训练-验证集)上比在开发集(验证集)上做得好得多。

C.【 √ 】你有很大的可避免偏差问题,因为你的训练集上的错误率比人为错误率高很多。

第七题

① 根据上一个问题的表格,一位朋友认为训练数据分布比验证/测试分布要容易得多。你怎么看?

A. 【  】你的朋友是对的。(即训练数据分布的贝叶斯误差可能低于验证/测试分布)。

B. 【  】你的朋友错了。(即训练数据分布的贝叶斯误差可能比验证/测试分布更高)。

C. 【  】没有足够的信息来判断你的朋友是对还是错。

D. 【  】无论你的朋友是对还是错,这些信息都对你没有用。

答案:

C.【 √ 】没有足够的信息来判断你的朋友是对还是错。

第八题

8.您决定将重点放在验证集上, 并手动检查是什么原因导致的错误。下面是一个表, 总结了您的发现:

  1. 验证集总误差 14.3%
  2. 由于数据标记不正确而导致的错误 4.1%
  3. 由于雾天的图片引起的错误 8.0%
  4. 由于雨滴落在汽车前摄像头上造成的错误 2.2%
  5. 其他原因引起的错误 1.0%

① 在这个表格中,4.1%、8.0%这些比例是占总验证集的比例(不仅仅是您的算法错误标记的样本),即大约8.0 / 14.3 = 56%的错误是由于雾天的图片造成的。

② 从这个分析的结果意味着团队最先做的应该是把更多雾天的图片纳入训练集,以便解决该类别中的8%的错误,对吗?

A. 【  】错误,因为这取决于添加这些数据的容易程度以及您要考虑团队认为它会有多大帮助。

B. 【  】是的,因为它是错误率最大的类别。正如视频中所讨论的,我们应该对错误率进行按大小排序,以避免浪费团队的时间。

C. 【  】是的,因为它比其他的错误类别错误率加在一起都大(8.0 > 4.1+2.2+1.0)。

D. 【  】错误,因为数据增强(通过清晰的图像+雾的效果合成雾天的图像)更有效。

答案:

A.【 √ 】错误,因为这取决于添加这些数据的容易程度以及您要考虑团队认为它会有多大帮助。

第九题

9.你可以买一个专门设计的雨刮,帮助擦掉正面相机上的一些雨滴。 根据上一个问题的表格,您同意以下哪些陈述?

A. 【  】对于挡风玻璃雨刷可以改善模型的性能而言,2.2%是改善的最大值。

B. 【  】对于挡风玻璃雨刷可以改善模型的性能而言,2.2%是改善最小值。

C. 【  】对于挡风玻璃雨刷可以改善模型的性能而言,改善的性能就是2.2%。

D. 【  】在最坏的情况下,2.2%将是一个合理的估计,因为挡风玻璃刮水器会损坏模型的性能。

答案:

A.【 √ 】对于挡风玻璃雨刷可以改善模型的性能而言,2.2%是改善的最大值。

第十题

10.您决定使用数据增强来解决雾天的图像,您可以在互联网上找到1,000张雾的照片,然后拿清晰的图片和雾来合成雾天图片,如下所示:
在这里插入图片描述

① 你同意下列哪种说法?(选出所有正确项)

A. 【  】只要你把它与一个更大(远大于1000)的清晰/不模糊的图像结合在一起,那么对雾的1000幅图片就没有太大的过拟合的风险。

B. 【  】将合成的看起来像真正的雾天图片添加到从你的汽车前摄像头拍摄到的图片的数据集对与改进模型不会有任何帮助,因为它会引入可避免的偏差。

C. 【  】只要合成的雾对人眼来说是真实的,你就可以确信合成的数据和真实的雾天图像差不多,因为人类的视觉对于你正在解决的问题是非常准确的。

答案:

C.【 √ 】只要合成的雾对人眼来说是真实的,你就可以确信合成的数据和真实的雾天图像差不多,因为人类的视觉对于你正在解决的问题是非常准确的。

第十一题

10.在进一步处理问题之后,您已决定更正验证集上错误标记的数据。 您同意以下哪些陈述? (选出所有正确项)

A. 【  】您不应更正训练集中的错误标记的数据, 因为这不值得

B. 【  】您应该更正训练集中的错误标记数据, 以免您训练集与验证集差距更大

C. 【  】您不应该更正测试集中错误标记的数据,以便验证和测试集来自同一分布

D. 【  】您还应该更正测试集中错误标记的数据,以便验证和测试集来自同一分布

答案:

A.【 √ 】您不应更正训练集中的错误标记的数据, 因为这不值得

D.【 √ 】您还应该更正测试集中错误标记的数据,以便验证和测试集来自同一分布

第十二题

12.到目前为止,您的算法仅能识别红色和绿色交通灯,该公司的一位同事开始着手识别黄色交通灯(一些国家称之为橙色光而不是黄色光,我们将使用美国的黄色标准),含有黄色灯的图像非常罕见,而且她没有足够的数据来建立一个好的模型,她希望你能用迁移学习帮助她。

① 你告诉你的同事怎么做?

A. 【  】她应该尝试使用在你的数据集上预先训练过的权重,并用黄光数据集进行进一步的微调。

B. 【  】如果她有10,000个黄光图像,从您的数据集中随机抽取10,000张图像,并将您和她的数据放在一起,这可以防止您的数据集“淹没”她的黄灯数据集。

C. 【  】你没办法帮助她,因为你的数据分布与她的不同,而且缺乏黄灯标签的数据。

D. 【  】建议她尝试多任务学习,而不是使用所有数据进行迁移学习。

答案:

A.【 √ 】她应该尝试使用在你的数据集上预先训练过的权重,并用黄光数据集进行进一步的微调。

第十三题

13.另一位同事想要使用放置在车外的麦克风来更好地听清你周围是否有其他车辆。 例如,如果你身后有警车,你就可以听到警笛声。 但是,他们没有太多的训练这个音频系统,你能帮忙吗?

A. 【  】从视觉数据集迁移学习可以帮助您的同事加快步伐,多任务学习似乎不太有希望。

B. 【  】从您的视觉数据集中进行多任务学习可以帮助您的同事加快步伐,迁移学习似乎不太有希望。

C. 【  】迁移学习或多任务学习可以帮助我们的同事加快步伐。

D. 【  】迁移学习和多任务学习都不是很有希望。

答案:

D.【 √ 】迁移学习和多任务学习都不是很有希望。

第十四题

14.要识别红色和绿色的灯光。

① 你一直在使用这种方法:将图像 x x x输入到神经网络,并直接学习映射以预测是否存在红光(和/或)绿光。

② 一个队友提出了另一种两步的方法:先要检测图像中的交通灯(如果有),然后确定交通信号灯中照明灯的颜色。

③ 在这两者之间,方法B更多的是端到端的方法,因为它在输入端和输出端有不同的步骤,这种说法正确吗?

A. 【  】对

B. 【  】不对

答案:

B.【 √ 】不对

第十五题

15.上一题中,A方法似乎比B方法更有效,如果你有一个__

A. 【  】大训练集

B. 【  】多任务学习的问题

C. 【  】偏差比较大的问题

D. 【  】高贝叶斯误差的问题

答案:

A.【 √ 】大训练集

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1133306.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

教师必备宝藏,强烈推荐

亲爱的教师朋友们,你们是不是在为学期末成绩查询而头疼呢?一学期下来,成堆的试卷和成绩单,还有学生家长的各种咨询,让人应接不暇。现在,我给你们分享一个教师必备的宝藏,让你们的成绩查询工作变…

Mac虚拟机哪个好用,CrossOver23.6虚拟机激活许可证激活码2023最新分享

刚买了苹果电脑的用户,经常会因为用不惯苹果系统而想换Windows系统,实际上也的确是,许多流行游戏或软件都暂不支持Mac系统,可行的办法是安装Mac虚拟机或是双系统,以供支持在苹果电脑上使用Windows应用。下面本文就来讲…

小程序如何设置自取规则

​在小程序中,自取规则是指当客户下单时选择无需配送的情况下,如何设置相关的计费方式、指定时段费用、免费金额、预定时间和起取金额。下面将详细介绍如何设置这些规则,以便更好地满足客户的需求。 在小程序管理员后台->配送设置->自…

JavaScript进阶 第二天笔记

JavaScript 进阶 - 第2天 了解面向对象编程的基础概念及构造函数的作用,体会 JavaScript 一切皆对象的语言特征,掌握常见的对象属性和方法的使用。 了解面向对象编程中的一般概念能够基于构造函数创建对象理解 JavaScript 中一切皆对象的语言特征理解引用…

Vue中的加密方式(js-base64、crypto-js、jsencrypt、bcryptjs)

目录 1.安装js-base64库 2. 在Vue组件中引入js-base64库 3.使用js-base64库进行加密 4.Vue中其他加密方式 1.crypto-js 2.jsencrypt 3.bcryptjs 1.安装js-base64库 npm install js-base64 --save-dev 2. 在Vue组件中引入js-base64库 import { Base64 } from js-ba…

springboot操作nosql的mongodb,或者是如何在mongodb官网创建服务器并进行操作

第一步:在mongodb的官网里面创建云服务器 点进去 这是免费的,由于是一个项目只可以创建一个,这里我已经创建好了 用本地的mongodb服务也是可以的 第二步:点击connect,下载连接mongodb的软件:MongoDBCompass 第三步&am…

钉钉小程序生态6—钉钉OA自定义审批流的创建和使用

文章导航 钉钉小程序生态1—区分企业内部应用、第三方企业应用、第三方个人应用 钉钉小程序生态2—区分小程序和H5微应用 钉钉小程序生态3—钉钉扫码登录PC端网站 钉钉小程序生态4—钉钉小程序三方企业应用事件与回调 钉钉小程序生态5—钉钉群机器人消息通知和钉钉工作通知 钉…

【嵌入式开发学习】__单片机中容易造成内存泄露的几个痛点

目录 前言 一、程序运行 二、什么是内存泄露? 三、内存泄露的严重后果! 四、如何定位到泄露的要点? 五、三大痛点 1. 访问越界 2. 栈 3. 堆 六、泄露常见的场景 1. 重新赋值 2. 首先释放父块 3. 返回值的不正确处理 七、常见的…

无监督学习-K-means

1、 什么是无监督学习 一家广告平台需要根据相似的人口学特征和购买习惯将美国人口分成不同的小组,以便广告客户可以通过有关联的广告接触到他们的目标客户。Airbnb 需要将自己的房屋清单分组成不同的社区,以便用户能更轻松地查阅这些清单。一个数据科学…

账号运营的底层逻辑---获客思维

什么是运营? 运营是做什么的? 什么是内容运营? 什么是活动运营? 一篇带你搞清楚所有的底层逻辑!

三、W5100S/W5500+RP2040树莓派Pico<TCP Client数据回环测试>

文章目录 1. 前言2. 协议简介2.1 简述2.2 优点2.3 应用 3. WIZnet以太网芯片4. TCP Client数据回环测试4.1 程序流程图4.2 测试准备4.3 连接方式4.4 相关代码4.5 测试现象 5. 注意事项6. 相关链接 1. 前言 在当今的计算机网络环境中,TCP(传输控制协议&am…

整理指定文件夹下的所有文件,以类树状图显示并生成对应超链接

最近在整理家里学习资料的时候,由于年代久远,找不到我想要找的文件,windows文件搜索速度感觉太慢。于是想要生成一份类似文件索引的东西来显示所有资料,让我可以快速的找到需要的资料路径 直接上代码 import os import datetim…

基于Java的医院远程预约管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding) 代码参考数据库参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者&am…

2、Linux权限理解

个人主页:Lei宝啊 愿所有美好如期而遇 目录 前言 Linux权限的概念 1.文件访问者的分(人) 2.文件类型和访问权限(事物属性) 3.文件权限值的表示方法 4.文件访问权限的相关设置方法 file指令 目录的权限 粘滞位 关于权限的总结 前言 在开始Linux权限理…

IDEA: 自用主题及字体搭配推荐

文章目录 1. 字体设置推荐2. 主题推荐3. Rainbow Brackets(彩虹括号)4. 设置背景图片 下面是我的 IDEA 主题和字体,它们的搭配效果如下: 1. 字体设置推荐 在使用 IntelliJ IDEA 进行编码和开发时,一个合适的字体设置可以提高你的工作效率和舒…

Python---for循环中的两大关键字break和continue

之前在while循环中,也是用到两个关键字。 相关链接: 所以,在循环结构中都存在两个关键字:break和continue break:主要功能是终止整个循环 break:代表终止整个循环结构 continue:代表中止当…

【Note】二叉树的遍历

二叉树的遍历 二叉树的基本结构:根节点(Data)、左子树(LChild)和右子树(RChild)。 因此只要依次遍历这三部分,就遍历了整个二叉树。 如果用L、D、R分别表示遍历左子树、访问根结点…

不用编程超简单的自动化测试工具:Airtest入门篇教程!

目录 一、背景 二、什么是Airtest 三、Airtest下载安装 四、Airtest入门使用教程 4.1 连接设备: 4.2 具体测试场景案例: 五、总结 一、背景 很多刚入行或从其他行业转行做测试的同学,日复一日每天做点工已经点得疲惫和麻木&#xff0…

SparkSQL执行流程与Catalyst优化器

目录 一、SparkSQL运行流程与Catalyst优化器 (1)RDD运行流程 (2)SparkSQL自动优化 (3)Catalyst优化器流程 (4)Catalyst优化器总结 (5)Spark SQL执行流程 一、…

Leo赠书活动-02期 【信息科技风险管理:合规管理、技术防控与数字化】

✅作者简介:大家好,我是Leo,热爱Java后端开发者,一个想要与大家共同进步的男人😉😉 🍎个人主页:Leo的博客 💞当前专栏: 赠书活动专栏 ✨特色专栏:…