week 9 吴恩达 迁移学习 多任务学习 端到端学习

news2025/1/13 17:27:34

文章目录

  • 一、错误分析
  • 二、快速构建系统然后迭代
  • 三、训练和测试的不同数据分布
    • 1、不匹配数据的偏差和方差
    • 2、解决数据不匹配问题。
  • 四、迁移学习 transfer learning
  • 五、多任务学习 multi-task learning
  • 六、端到端 end-to-end learning


一、错误分析

当我们在构建一个系统时,我们可以采用人工方法来分析错误率主要是由什么造成的。
比如一个识别猫的系统,我们可以取出100张分析错误的照片,来看分析错误的主要原因是什么,比如将狗识别成猫的概率有百分之40,因为图片模糊而识别错误占百分之9等,我们就可以有一个很好的理由来去通过狗与猫的特征来提高识别准确率。

但是这个错误也可能是由于我们一开始标签标记错了

比如一张猫的图片,我们一开始标记成了0,不是猫,但是最后系统识别出为1,我们也可以采用错误分析来人工检测这个标记错误的情况值不值得我们花费时间去修改错误,如果所占比例比较小,则我们就可以忽略这个错误。

二、快速构建系统然后迭代

如果我们在研究一个全新的领域,没有大量论文等支撑,则我们可以先确定开发集与测试集和度量指标,之后快速搭建起我们的系统,不必太复杂,之后通过偏差/方差以及人工进行错误分析,来提高我们系统的准确率。

但是如果我们研究的是一个很成熟的领域或者我们研究的领域有大量论文支撑,那么就不适合该方法。


三、训练和测试的不同数据分布

1、不匹配数据的偏差和方差

训练数据和开发集/测试集的分布不同
train 与 tarin-dev 有相同的分布
dev 与 test 有相同的分布。

这里我们把训练数据集分为tarin set和train-dev set.
神经网络只能看到train set,通过train set来训练模型.
训练完模型之后 将train-dev 放入模型来检测error。
若 human-level error 为0%,train-error 为1%,train-dev error 为9%,dev error 为10%,则证明我们的模型方差过大。
若 human-level error 为0%,train-error 为1%,train-dev error 为1.5%,dev error 为10%,则证明我们模型的data mismatch 问题过大,我们应该解决data mismatch 问题。
若 human-level error 为0%,train-error 为10%,train-dev error 为11%,dev error 为11.5%,则证明我们模型的可避免偏差问题过大。
若 human-level error 为0%,train-error 为10%,train-dev error 为11%,dev error 为20%,则证明我们模型的不仅可避免偏差问题过大 而且data mismatch 问题也过大。

同样 如果有test error ,我们可以根据它与dev-error 的差距来看是否模型对于dev set 出现了过拟合的现象。

同样,也可能出现在dev set的error 小于 train 与train-dev。这可能是由于我们关注的数据集比训练集容易操作。
在这里插入图片描述
如图,我们以后视镜语音系统为例,假设我们得到了许多语音识别数据作为训练集,而我们真正关注的是后视镜的语音识别数据,通过不同数据的error 我们可以看出我们的模型应该在哪里进行改进。

2、解决数据不匹配问题。

①可以人工进行误差分析,来看我们的训练数据与开发集主要的差异在哪里。
②通过查找主要误差我们可以通过人工合成等方式来使训练数据更贴合开发数据集。

比如 如果我们在语音激活后视镜系统重,我们的训练数据与开发数据的主要差异在于开发数据有汽车噪音,那么我们可以通过人工合成的方式,在训练数据集上添加上汽车噪音。

但是通过人工合成的方式时我们要注意,是否我们采用的只是所有数据的一部分子集。比如汽车噪音,我们人工合成使用的如果只是汽车噪音的一部分子集,就会造成我们对这部分噪音经行了过拟合。
又比如汽车检测,我们要注意是否我们合成的汽车模型,只是所有汽车的一小部分子集呢。

四、迁移学习 transfer learning

在这里插入图片描述

①当任务A和任务B有相同的输入时,比如识别猫 与 检测X光片 输入都是图片
②任务A比任务B有多得多的数据。
就是比如我们识别猫系统(A)可以获得大量的图片,但是X光片(B)获得的图片很少,都是图片,在神经网络较低层提取的特征是相通的,可以迁移,所以我们可以通过训练A获得的参数来应用到任务B,只需修改最后一层参数以及权值。
③任务A低层次获取的特征有助于任务B
见②

五、多任务学习 multi-task learning

比如图片检测中,我们可以进行多任务,比如给一张图片,我们可以同时进行 是否有红绿灯,是否有汽车,是否有行人等多个输出任务。

在这里插入图片描述
第一点,比如都是图像识别,所以低层次获得的特征是相同的。
第二点不是必须的。
第三点,通过训练一个大的神经网络 会使多任务比单一任务的效果更好。

六、端到端 end-to-end learning

端到端学习就是 对于输入x 可以直接输出y,没有了中间多个途径组成的通道
比如语音识别。给出一段音频可以直接输出对应的文字,没有中间阶段 如识别出音频 音素等。
在这里插入图片描述

在这里插入图片描述
端到端学习的优缺点
在这里插入图片描述

端到端学习使数据占主导地位,比如传统的语音识别,是人为设计的音频,因素这些中间学习阶段,但是如果使用端到端学习,或许神经网络会自动找到一种更好的语音识别算法,没有太多人为设计。

但是端到端学习需要大量的数据支撑。比如通过儿童手掌x光片来推测年龄。
如果单单使用端到端系统是很困难的一项任务。
此时,我们采用传统的方法,分开中间阶段,如第一阶段首先识别到骨骼区域,之后通过计算出骨骼的平均长度等信息来计算年龄,这两步都不复杂,只需要少量数据就可以训练出好的算法。
所以端到端学习可能会排除那些原本有效的人为设计。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/156332.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

自动驾驶BEV火了,再给它加点脑洞会靠谱吗?

作者 | 洪泽鑫 编辑 | Bruce百度今年Create大会上辅助驾驶板块的内容挺硬核的,不在这个行业内基本听不懂。 正好是研究兴趣所在,结合百度给的资料,试着来中译中一下。 总的来说,百度是弄了一个车路一体的BEV感知方案——叫UniBEV。…

基于FPGA的UDP 通信(二)

引言前文链接:基于FPGA的UDP 通信(一)本文继续介绍与以太网数据协议相关的内容。以太网帧协议IEEE802.3标准规定了,以太网数据传输的格式:字段解释:字段名称字段长度/(字节)含义前导…

【MyBatis】第二篇:核心配置文件常用标签

前提 Mbatis的配置文件中的顺序如下: MyBatis核心配置文件中的标签必须安装指定的顺序配置。 (properties?,settings?,typeAliases?,typeHandlers?,objectFactory?,objectWrapperFactory?,reflectorFactory?,plugins?,environments?,databaseIdProvider?…

SweetAlert让消息弹出窗口更加具有个性化!

SweetAlertSweetAlert是指可对JavaScript标准功能alert()和confirm()进行个性化定制的库。SweetAlert的要点官网上有很多示例,看了这些基本上就OK了。但是,在kintone上使用时,【弹出消息后更新页面】这个处理只参照示例来写的话,一…

微信小程序分包

1.什么是分包? 分包指的是把一个完整的小程序项目,按照需求划分为不同的子包,在构建时打包成不同的分包,用户在使用时按需进行加载。 2.分包的好处对小程序进行分包的好处主要有以下两点: 可以优化小程序首次启动的下载时间在多…

Elasticsearch 核心技术(四):索引管理、映射管理、文档管理(REST API)

❤️ 个人主页:水滴技术 🚀 支持水滴:点赞👍 收藏⭐ 留言💬 🌸 订阅专栏:大数据核心技术从入门到精通 文章目录一、索引管理1. 创建索引创建一个索引索引设置映射字段别名2. 获取索引3. 删除索…

阿拉伯数转中文与英文[找到规律,抽象问题,转换成代码]

阿拉伯数转中文与英文前言一、阿拉伯数字转换1、阿拉伯数字转中文a、案例b、解决方案2、阿拉伯数转英文a、案例b、解决方案总结参考文献前言 如果思考算法的解法方案是一种模拟,那么这一般不是个好的解决方案。对于一个复杂的问题,挖掘其中的规律&#…

制造业管理系统如何帮助企业快速应对品质异常问题?

在企业生产制造过程中,成品发生品质异常问题是不可避免的。当成品出现问题,为了有效防范批量品质事故,品管需要快速判断可能是哪个材料引起的,需要知道这批成品是谁做的,什么时候做的,提供材料的分别是哪个…

MySQL基础篇语句--DDL语句

SQL简介 当面对一个陌生的数据库时,通常需要一种方式与它交互,以完成用户所需要的各种工作,这个时候,就要用到SQL语言了。 SQL是Structure Query Language(结构化查询语言)的缩写,它是使用关系模型的数据库应用语言,由…

传统推荐模型(一)协同过滤算法_UserCF和ItemCF

传统推荐模型(一)协同过滤算法_UserCF 1、UserCF 协同过滤就是协同大家的反馈、评价和意见一起对海量的信息进行过滤,从中筛选出目标用户可能感兴趣的信息的推荐过程。 物品1物品2物品3物品4物品5用户131233用户243435用户333154用户41552…

OneNote(或印象笔记)迁移到Joplin的方法

2023年1月10日实操记录简介背景是必须卸载OneNote,所以要迁移笔记。告别了用了23年的Outlook ,和10年左右的OneNote,小伤感,自此一别 就不能用练就的VBA技能在Excel和Access中处理数据了。。。基本前提Joplin支持.enex格式文件的导…

总结述职报告撰写方法,报告目的、对象、内容、技巧等

导语 又到年末时,述职报告再一次席卷而来。这篇文章将带来干货满满的述职报告撰写方法,包括述职目的、对象、内容、技巧等多个方面。 一、述职目的 有多少人认为,述职只是走个形式,走个过场的? 如果你这样认为&#x…

2023济南制药机械展|中国(济南)国际制药机械与包装技术展览会

2023中国(济南)国际制药机械与包装技术展览会将于2023年3月30-4月1日在山东国际会展中心(济南市槐荫区日照路1号)同期举办:2023第11届国际生物发酵展2023国际生化仪器与实验室装备展2023国际生物技术与生物制药展支持单…

以太网链路聚合与交换机堆叠、集群

网络的可靠性 网络的可靠性指当设备或者链路出现单点或者多点故障时保证网络服务不间断的能力网络的可靠性可以从单板、设备、链路多个层面实现 一般重要的核心设备都有一定的冗余 s12700E-8机框正面结构 框式交换机由机框、电源模块、风扇模块、主控板、交换网板&#xff…

CSS入门六、常用技巧

零、文章目录 文章地址 个人博客-CSDN地址:https://blog.csdn.net/liyou123456789个人博客-GiteePages:https://bluecusliyou.gitee.io/techlearn 代码仓库地址 Gitee:https://gitee.com/bluecusliyou/TechLearnGithub:https:…

人工智能-linux高级操作命令

目录1、 重定向命令2、查看文件内容命令3、链接命令3.1 软链接4、查找文件内容命令5、查找文件命令6、压缩和解压缩文件7、文件权限命名8、获取管理员权限的相关命令9、远程登陆、远程拷贝10、软件安装与卸载11、vim介绍1、 重定向命令 将目录下的文件名全部写入新文件 touch …

场景编程集锦 - BMI指数与健身达人

1. 场景描述 BMI指数(身体质量指数,英文Body Mass Index)是用体重公斤数除以身高米数的平方得出的数字,是目前国际上通用的衡量人体胖瘦程度以及是否健康的一个标准。“身体质量指数”这个概念,是由19世纪中期的比利时…

马蹄集 宽度与对齐

宽度与对齐 难度:白银 时间限制:1秒巴占用内存:64M 输出455、-123、987654,宽度为5,分别左对齐和右对齐 格式 输入格式:无 输出格式:输出为整型,空格分隔。每个数的输出占一行 #inc…

[34]. 在排序数组中查找元素的第一个和最后一个位置

在排序数组中查找元素的第一个和最后一个位置题目算法设计:二分查找题目 算法设计:二分查找 进行两次二分查找(定制版本),第一次先查找【第一个大于等于target的数】,第二次再查找【第一个大于target的数】…

Mac安装python3并配置环境变量

文章目录homebrew 安装 python3配置 python3 环境变量homebrew 安装 python3 可以用 homebrew 安装,也可以官网下载安装,我这里选择使用 homebrew 安装,没有装 homebrew 的小伙伴请自行百度 brew install python3我们执行下 python3 发现可…