迁移学习入门,新手该如何下手?

news2024/11/25 5:40:07

推荐迁移学习技术的实用入门图书:《自然语言处理迁移学习实战》

[加纳] 保罗·阿祖雷(Paul Azunre) 著,李想,朱仲书,张世武 译

一本书带你读懂ChatGPT背后的技术,自然语言处理迁移学习,解锁机器学习新境界,从浅层到深度,掌握NLP迁移学习的奥秘,让你的模型脱颖而出!

推荐理由:

适合拥有NLP基础的机器学习和数据科学相关的开发人员阅读,也适合作为高等院校计算机及相关专业的学生参考用书。

  • 内容基础且实用。本书是关于迁移学习技术在NLP领域的实用指南,能够帮助读者快速了解相关的机器学习概念,并将其应用于现实世界的问题。
  • 内容技术新。本书详细介绍了如何使用迁移学习技术来解决新场景、新任务和新环境的问题,使得机器学习系统更加可靠和鲁棒。
  • 具有实战性。本书提供了如何使用迁移学习来改进NLP模型的实践指导,读者可以学习如何从预训练模型开始,调整以满足确切的需求,从而提供先进的结果。
  • 涵盖广泛主题。本书涵盖了各种NLP应用程序,包括垃圾电子邮件分类器、IMDb电影评论情绪分析器、自动事实检查器、问答系统和翻译系统等,使读者能够全面了解迁移学习在NLP领域的应用。
  • 参考价值高。本书不仅适合拥有NLP基础的机器学习和数据科学的开发人员阅读,同时也适合高等院校计算机及相关专业的学生和软件学院的学生参考,具有很高的参考价值。
  • 清晰易懂的文字表述:本书采用简洁明了的文字表述,使读者能够轻松理解书中的内容,降低阅读门槛。
  • 本书的讲解深入浅出,既有完备的数学论证,又通过生动的语言帮助读者建立感性的认知,让人不禁为作者的匠心喝彩!同时本书以若干NLP领域的常见问题作为主线,通过示例代码引领读者亲自实践,领略NLP迁移学习带来的实实在在的业务效果提升,

内容简介:

迁移学习作为机器学习和人工智能领域的重要方法,在计算机视觉、自然语言处理(NLP)、语音识别等领域都得到广泛应用。本书是迁移学习技术的实用入门图书,能够带领读者深入实践自然语言处理模型。首先,本书回顾了机器学习中的关键概念,并介绍了机器学习的发展历史,以及NLP迁移学习的进展;其次,深入探讨了一些重要的NLP迁移学习方法—NLP浅层迁移学习和NLP深度迁移学习;最后,涵盖NLP迁移学习领域中重要的子领域—以Transformer作为关键功能的深度迁移学习技术。读者可以动手将现有的先进模型应用于现实世界的应用程序,包括垃圾电子邮件分类器、IMDb电影评论情感分类器、自动事实检查器、问答系统和翻译系统等。

本书文字简洁、论述精辟、层次清晰,既适合拥有NLP基础的机器学习和数据科学相关的开发人员阅读,也适合作为高等院校计算机及相关专业的学生参考用书。

专业评论:

这本书对NLP背景下的迁移学习做了精彩阐述。内容深入浅出,案例丰富,值得深入阅读。迁移学习本质上是知识、算力的复用。在目标检测、模式识别、NLP等领域,迁移学习大有可为。
——许国强,三一重工SaaS首席信息官

迁移学习是近几年NLP领域最重要的研究方向之一。这本书以实例和代码的形式对NLP迁移学习的基本概念、业务应用以及发展方向做了详细介绍。这本书介绍的多个先进模型和算法在业务实践中都得到广泛应用。对想了解NLP迁移学习并在实际工作中落地的研究人员来说,这是一本很好的参考书。
——梁磊,蚂蚁集团资深技术专家

迁移学习技术在感知类机器学习场景取得了长足的进步,尤其是BERT系列的预训练模型将NLP领域的基线提升到新的高度。这本书系统、全面且贴合实际地介绍了这个高速发展的主题,值得NLP领域的工程师深入阅读和探究。
——朱亮,Meta(原Facebook)资深算法工程师

迁移学习是机器学习领域一次革命性的技术突破,特别是在NLP领域取得了令人振奋的成就。同时,我们相信迁移学习深刻的思想也会应用到其他领域,并且取得不错的成绩。推荐机器学习相关领域的工程师阅读这本书,保持对迁移学习的持续关注。
——刘冰洋,Google资深算法工程师

这本书对迁移学习的理论给出了全面且翔实的介绍,可以帮助读者建立清晰的认知。更为难得的是,这本书以实际的业务问题作为驱动,引领读者阅读和学习。推荐给NLP领域的相关工程师。

——赵海,美团技术专家

完整目录

第一部分 导论

第1章 迁移学习简介 3

1.1 NLP领域典型任务概述 5

1.2 理解人工智能背景下的NLP技术 6

1.2.1 人工智能 7

1.2.2 机器学习 7

1.2.3 自然语言处理 11

1.3 NLP发展简史 12

1.3.1 NLP简介 12

1.3.2 迁移学习的进展 14

1.4 计算机视觉中的迁移学习 16

1.4.1 概述 16

1.4.2 ImageNet预训练模型 17

1.4.3 ImageNet预训练模型的微调 18

1.5 NLP迁移学习成为一个令人兴奋的研究课题的原因 19

小结 20

第2章 从头开始:数据预处理 21

2.1 垃圾电子邮件分类任务中示例数据的预处理 23

2.1.1 加载并检视Enron电子邮件语料库 24

2.1.2 加载并检视欺诈电子邮件数据集 26

2.1.3 将电子邮件文本转换为数值 30

2.2 电影评论情感分类任务中示例数据的预处理 32

2.3 广义线性模型 35

2.3.1 逻辑斯谛回归 36

2.3.2 支持向量机 38

小结 38

第3章 从头开始:基准测试和优化 41

3.1 基于决策树的模型 41

3.1.1 随机森林 42

3.1.2 梯度提升机 42

3.2 神经网络模型 47

3.2.1 语言模型嵌入 47

3.2.2 BERT模型简介 52

3.3 效果优化 56

3.3.1 手动超参调优 56

3.3.2 系统化超参调优 57

小结 58

第二部分 基于循环神经网络的浅层迁移学习和深度迁移学习

第4章 NLP浅层迁移学习 63

4.1 基于预训练词嵌入的半监督学习 65

4.2 基于高级表示的半监督学习 69

4.3 多任务学习 71

4.3.1 问题的提出以及浅层神经网络单任务基线 72

4.3.2 双任务实验 74

4.4 领域适配 75

小结 78

第5章 基于循环神经网络的深度迁移学习实验的数据预处理 79

5.1 表格分类数据的预处理 81

5.1.1 获取并检视表格数据 82

5.1.2 预处理表格数据 85

5.1.3 对预处理数据进行数字编码 87

5.2 预处理示例数据的事实核查 87

5.2.1 特殊问题考量 88

5.2.2 加载并检视事实核查数据 88

小结 89

第6章 基于循环神经网络的NLP深度迁移学习 91

6.1 SIMOn 91

6.1.1 通用神经网络结构概述 92

6.1.2 表格数据建模 93

6.1.3 SIMOn在表格数据分类中的应用 93

6.2 ELMo 100

6.2.1 ELMo双向语言建模 101

6.2.2 ELMo在虚假新闻检测任务中的应用 102

6.3 ULMFiT 104

6.3.1 以语言模型为目标任务的微调 104

6.3.2 以分类为目标任务的微调 105

小结 105

第三部分 基于Transformer的深度迁移学习以及适配策略

第7章 基于Transformer的深度迁移学习和GPT 109

7.1 Transformer 110

7.1.1 transformers库简介与注意力可视化 113

7.1.2 自注意力 115

7.1.3 残差连接、编码器-解码器注意力和位置编码 117

7.1.4 预训练的编码器-解码器在机器翻译任务中的应用 120

7.2 GPT 121

7.2.1 模型结构概述 122

7.2.2 Transformer pipeline及其在文本生成任务中的应用 124

7.2.3 聊天机器人任务中的应用 126

小结 128

第8章 基于BERT和mBERT的NLP深度迁移学习 129

8.1 BERT 130

8.1.1 BERT模型结构 131

8.1.2 在自动问答任务中的应用 134

8.1.3 在空白填写和后续句预测任务中的应用 136

8.2 mBERT的跨语言学习 138

8.2.1 JW300数据集概述 139

8.2.2 用预训练分词器将mBERT迁移到Twi单语言数据 139

8.2.3 根据Twi单语言数据从头训练mBERT模型和分词器 142

小结 143

第9章 ULMFiT与知识蒸馏的适配策略 145

9.1 逐步解冻和差别式微调 146

9.1.1 预训练语言模型微调 147

9.1.2 以分类为目标任务的微调 149

9.2 知识蒸馏 151

小结 156

第10章 ALBERT、适配器和多任务适配策略 157

10.1 嵌入因子分解与跨层参数共享 158

10.2 多任务微调 162

10.2.1 GLUE数据集 163

10.2.2 GLUE单任务微调 164

10.2.3 序列化适配 167

10.3 适配器 169

小结 171

第11章 总结 173

11.1 关键概念概述 174

11.2 其他新兴研究趋势 179

11.2.1 RoBERTa 180

11.2.2 GPT-3 180

11.2.3 XLNet 182

11.2.4 BigBird 182

11.2.5 Longformer 182

11.2.6 Reformer 183

11.2.7 T5 183

11.2.8 BART 184

11.2.9 XLM 185

11.2.10 TAPAS 185

11.3 NLP迁移学习的发展方向 186

11.4 伦理和环境因素 187

11.5 最新进展 189

11.5.1 Kaggle和Zindi比赛 189

11.5.2 arXiv 190

11.5.3 新闻与社交媒体 190

11.6 写在最后 191

附录A Kaggle入门 193

A.1 通过Kaggle Kernel免费使用GPU 193

A.2 竞赛、讨论区和博客 198

附录B 深度学习的基础工具简介 201

B.1 随机梯度下降 202

B.2 TensorFlow 203

B.3 PyTorch 206

B.4 Keras、fast.ai库和Hugging Face的transformers库 207

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/718356.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Xcode Build System

Xcode Build System iOS开发者都使用Xcode来开发、编译程序,但是我们真正了解xcode是怎样编译我们的程序到手机上的么,下面我们主要看看xcode的编译系统内容 一、Preprocessor 预处理:在此步骤中xcode会处理代码中的宏,将其展开…

19k字图文讲解Vision科研常用的系统环境配置和工具(附详细命令行)

猛码Memmat | 转载请注明来源 最近作者有了新设备,趁更新系统写一篇博客为小白讲解这一入门过程 目录 ArchLinux 安装指南(新手向)前言准备工作检查网络通过 SSH 远程连接(可选)硬盘分区格式化并挂载分区设置中国镜像源(推荐)安装系统系统初始化设置进阶设置设置交换空…

VScode中的插件

开启VScode中最简单的内部浏览器 - 可以访问外网 - Browser Preview 插件安装: 插件使用:由下角 - 状态栏 - VS Browser按钮 live sass compiler-vscode插件将scss编译为css live sass compiler是VSCode扩展,可以实时地将SASS / SCSS文件…

基于Spring Boot的智慧社区系统设计与实现(Java+spring boot+MySQL)

获取源码或者论文请私信博主 演示视频: https://www.bilibili.com/video/BV1kF411R7Tp/?vd_sourced8d0eebf6c94c5aa49fe3f992c8887b0使用技术: 前端:html css javascript jQuery ajax thymeleaf 后端:Java springboot框架 myba…

Django搭建图书管理系统01

Django框架 Django是一个使用Python编写的开源Web应用程序框架。它采用了MVC(Model-View-Controller)的软件设计模式,旨在简化开发复杂的Web应用程序。 以下是Django框架的一些主要特点: 强大的开发工具:Django提供了…

计算机毕业论文内容参考|基于Python的入侵检测系统的设计与实现

文章目录 导文摘要前言绪论课题背景国内外现状与趋势课题内容相关技术与方法介绍系统分析系统设计系统实现系统测试总结与展望导文 计算机毕业论文内容参考|基于Python的入侵检测系统的设计与实现 摘要 本文介绍了基于Python的入侵检测系统的设计与实现。首先,简要概述了入侵…

ubuntu中使用docker部署mysql

docker images:查看已有镜像docker pull mysql:拉取镜像docker ps -a:查看已有容器docker -o mysql8.0.33.tar(保存镜像使用的名称) mysql(被保存的镜像):避免重复下载,可…

CMU 15-445 -- Tree Indexes - 05

CMU 15-445 -- Tree Indexes - 05 引言Table IndexB TreeB-Tree FamilyB TreeB Tree NodesB Tree OperationsIn Practice Clustered IndexesCompound IndexB Tree Design ChoicesNode SizeMerge ThresholdVariable Length KeysNon-unique IndexesIntra-node Search Optimizatio…

Nginx配置图片服务器

Nginx配置图片服务器 背景请求示例Nginx配置图片服务器问题存在 背景 在我们日常做项目的时候,我们有时候会经常碰到图片需要放到哪?有时候会用第三方的图片存储,比如腾讯云的COS,阿里云的OOS。当然有时候我们也是需要放到Linux的…

找不到 配置管理器。sql server 2008 r2 在win10下

win10 打开sqlserver2008r2的SQL Server 配置管理器 ,通过开始程序中找不到“SQL Server 配置管理器”。去自己电脑上此目录找,“C:\Windows\SysWOW64\SQLServerManager10.msc”,直接运行此文件就可以调出“SQL Server 配置管理器”。 在win1…

docker环境下安装RabbitMQ3.8.2

一、下载指定版本镜像 [rootnginx ~]# docker pull rabbitmq:3.8.2-management 二、创建容器,并映射相关接口 [rootnginx ~]# docker run -d --name rabbitmq -p 5671:5671 -p 5672:5672 -p 4369:4369 -p 25672:25672 -p 15671:15671 -p 15672:15672 rabbitmq:3.8.2…

Spring Boot 中的 Seata 分布式事务

Spring Boot 中的 Seata 分布式事务 在分布式系统中,保证数据的一致性是一个非常重要的问题。传统的 ACID 事务模型虽然能够保证单个数据库的数据一致性,但是在分布式系统中却很难实现。因此,近年来出现了一些新的事务模型,其中 …

【QT】QIcon设置窗口小图标(12)

如何设置窗口小图标呢,很简单! 导入库: from PyQt5.QtGui import QIcon ##导入库if __name__ __main__:app QApplication(sys.argv)MainWindow QMainWindow()ui xxx.Ui_MainWindow()ui.setupUi(MainWindow)app.setWindowIcon(QIcon(xxx…

全议程公布丨涌现中重塑,PingCAP 用户峰会 2023 邀你共同引领创新力量!

7 月 13 日,PingCAP 用户峰会 2023 将在北京市海淀区西南华邑酒店举办,线上线下同步。本届大会主题为“创新涌动于先”,汇聚前沿数据科技与商业洞见,现场将有来自银行、保险、证券、政府、运营商、零售、制造、能源、物流、技术出…

Linux之进程信号

一、什么是进程信号 进程信号是一种事件通知机制,属于软件中断 信号的作用:发生某事件时,打断进程当前操作,转而去处理这个事件 例子: 假设你正在学习,没有突发事件你不会停止学习。(此时你就…

ubuntu安装MobaXterm和WPS

文章目录 ubuntu安装MobaXtermi386 架构wine操作步骤 ubuntu安装WPS操作步骤WPS版本知识补充 ubuntu安装MobaXterm i386 架构 sudo dpkg --add-architecture i386 是一个Linux系统中的命令,用于添加一个新的架构(architecture)支持到当前系统…

Ant Design4中Form.List和shouldUpdate一起使用的坑

背景 在antd3.x版本中,如果要实现一组表单增加删除的功能,需要Array.map()加上state状态来控制,代码比较复杂,而且非常不优雅。 其次在antd3.x中,表单中任何一个表单项的内容更新都会触发页面重新渲染,这在…

自定义MVC引用XML配置文件实现

目录 前言 自定义MVC实现 1. 导入XML配置文件 2. 导入XML解析建模 3. 优化中央控制器 3.1 修改DisPathServlet中init初始化方法 3.2 修改ActionServlet逻辑处理流程 3.3 通过反射机制实例化子控制器类 3.4 中央控制器将请求委托给子控制器处理 3.5 根据请求结果码跳…

【运维工程师学习】低级格式化磁盘

【运维工程师学习】低级格式化磁盘 1、查看需要格式化的磁盘2、下载低级格式化工具3、打开低级格式化工具,选择目标磁盘,并操作 1、查看需要格式化的磁盘 找不到目标磁盘的话需要到磁盘管理去找,这边我要低级格式话的磁盘是磁盘0 2、下载低级…

BPMNJS 在HTML中的引入与使用

BPMNJS 在HTML中的引入与使用 在网上看到的大多是基于vue使用BPMN的示例或者教程,竟然没有在HTML使用的示例,有也是很简单的介绍核心库的引入和使用,并没有涉及到扩展库。于是简单看了下,真的是一波三折,坎坎坷坷。不过…