学习大语言模型(LLM),从这里开始

news2024/11/16 9:48:47

在见识了ChatGPT的各种强大能力后,不少 NLP一线从业人员很自然地想到,以后开发者只要借助 ChatGPT,就可以做到现在大部分NLP工程师在做的事,比如文本分类、实体抽取、文本推理等。甚至随着大语言模型(largelanguagemodel,LLM)能力的不断提升,它们可能做得比NLP 工程师都要好。

如何利用大语言模型做一些NLP任务或服务?这本关于大语言模型的开发指南《ChatGPT原理与应用开发》来啦!

ChatGPT原理与应用开发

Datawhale的开源大模型实战教程,透彻解读4类常见NLP任务的系统设计,书-课-代码仓库全方位学习,每个人都可以用大语言模型轻松做出自己的AI产品。

本书主要面向非算法、有一定编程基础、对人工智能和 ChatGPT(或其他类似的大语言模型)感兴趣,并乐意使用大语言模型接口开发相关应用的读者。当然,部分内容不需要任何编程经验也可以学习。通过本书进一步降低大语言模型的使用 门槛,让更多对人工智能和大语言模型感兴趣的非 NLP 工程师或算法专业人士, 能够无障碍地使用大语言模型并创造价值。希望新的技术突破能够更多地改善我 们所处的世界。

本书内容

本书内容聚焦于如何使用大语言模型开发新的功能和应用,一共有 8 章内 容,分别如下。

第 1 章 基础知识 —大语言模型背后,主要介绍了与 ChatGPT 相关 的 NLP 领域的基础知识和原理,具体内容包括自然语言背景、Token 与 Embedding、语言模型、Transformer、GPT和RLHF 等。掌握了这部分知 识,就能大概知道 ChatGPT 或其他大语言模型是怎么回事。

第 2 章 相似匹配—万物皆可 Embedding, 主要介绍了文本表示, 以 及与文本匹配相关的任务和应用。这是 NLP 领域(以及其他一些算法领 域)最常用的技术,具体内容包括相似匹配基础、接口使用,以及简单 问答、聚类任务和推荐应用。

第 3 章 句词分类—句子 Token 都是类别,主要介绍了 NLP 领域最常 见的任务—分类。这其实也是人类最基本的认知方式(比如用男或女、 老或少、勤奋、乐于助人等简单的标签化方式具象化某个个体),具体内 容包括句词分类基础、接口使用,以及文档问答、模型微调和智能对话 应用。

第 4 章 文本生成—超越理解更智能,主要介绍了与文本生成技术相 关的任务,具体内容包括文本摘要、文本纠错和机器翻译。文本生成技 术在实际场景中的使用相对少一些,也相对独立一些。

第 5 章 复杂推理—更加像人一样思考,主要介绍了如何使用大语言 模型做复杂的逻辑推理任务。这部分内容在现实中的应用很少,但在新 的产品形态上有很多想象空间。

第 6 章 工程实践—真实场景大不同,主要介绍了如何在真实业务上 使用大语言模型。我们不再仅仅构建一个简单的 Demo(demonstration 的 简写,指示例、样品),而是要将大语言模型真正用在产品开发上。我们 会给出一些需要特别注意的事项,以帮助读者更高效地构建应用。

第 7 章 局限与不足—工具不是万能的,主要介绍了 ChatGPT(或其 他类似的大语言模型)的缺陷或不擅长的地方,包括事实性错误、实时 更新、性能瓶颈等方面。我们在畅想和利用 ChatGPT 或其他类似的大语言模型做各种人工智能应用时,也应该了解其不擅长的地方:一方面要 对其有更加全面的认识;另一方面,反向思维有时候也能想象出好的应 用或服务。

第 8 章 商业应用—LLM是星辰大海,可以把该章当作一篇调研报告 来阅读,主要针对工具应用和行业应用两大方面展开,期望能够给读者 更多启迪,帮助大家构思更好的应用或服务。

本书有两个基本的设计理念。

各章相对独立,彼此之间没有明显的依赖关系。这既体现在内容上,也 体现在设计上。读者可以灵活选取自己感兴趣的章节阅读。

以“任务”为核心。我们始终强调“任务”多于“工具”,ChatGPT 是目 前大语言模型领域总体效果最好的,但未来一定会有其他大语言模型出 现。不过,只要我们理解了要做的事情,理解了系统设计,工具就能为 我们所用。

阅读建议

通过上面的介绍,相信读者应该对本书有了初步了解。下面主要从创作者的 角度简单说明如何更好地使用本书。

第一,我们期望读者能够亲自动手完成一个应用或服务的 Demo 。光看不做 在编程领域是绝对不行的,实践出真知,脑子想、嘴上说与亲自干完全不一样。 而且,万事开头难,做了第一个,后面再做类似的就会相对容易一些。

第二,我们期望读者能在学习过程中多思考,既可以与自己工作的实际业务 相结合,也可以天马行空地构想。我们非常期待读者能分享自己的想法,众人拾 柴火焰高,个人能想到的太少了,但这么多人一起想,也许能够改变一个行业。

第三,我们期望读者能对 NLP 领域的常见任务有个基本的认识。我们并非 想要读者都成为 NLP 工程师,阅读本书也不会让你成为 NLP 工程师。但我们期望读者能够利用 ChatGPT (或其他类似的大语言模型)提供的接口来完成 NLP 任务,并提供相关服务。期望读者在阅读完本书后都具备这样的能力。

第四,洛克菲勒说过:真正重要的不在于有多少知识,而在于如何使用现有 的知识。知识只是潜在的力量,只有将其付诸应用,而且是建设性的应用,才会 显示出其威力。本书内容围绕着任务展开,很多设计思路和细节其实可以应用到 多个领域。我们再次强调,期望读者能够多实践,多应用,尤其是与自己的工作 多结合。

第五,由于创作团队精力有限,本书难免有疏漏甚至错误,我们期望读者在 学习的同时,也能积极给我们提建议,我们将不胜感激。

ChatGPT 火爆背后蕴含着一个基本道理:人工智能能力得到了极大突破— 大模型,尤其是大语言模型的能力有目共睹,未来只会变得更强。世界上唯一不 变的就是变化。适应变化、拥抱变化、喜欢变化。“天行健,君子以自强不息。” 我们相信未来会有越来越多的大模型出现。人工智能正在逐渐平民化,将来每个 人都可以利用大语言模型轻松地做出自己的人工智能产品。我们正在经历一个伟 大的时代,我们相信这是一个值得每个人全身心拥抱的时代,我们更加相信这个 世界必将因此而变得更加美好。

详细目录

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1479829.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于java+springboot女士电商平台系统源码+文档设计

基于javaspringboot女士电商平台系统源码文档设计 博主介绍:多年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《1000套》 欢迎点赞 收藏 ⭐留言 文末获取源…

WebStorm 2023:让您更接近理想的开发环境 mac/win版

JetBrains WebStorm 2023激活版下载是一款强大而智能的Web开发工具,专为提高开发人员的生产力而设计。这款编辑器提供了许多先进的代码编辑功能,以及一系列实用的工具和插件,可帮助您更快地编写、调试和测试代码。 WebStorm 2023软件获取 We…

【外汇天眼】交易技术三要素:趋势与震荡,突破与假突破,动力与约束

趋势与振盪 大多数人的做法是,假定当前所操作的品种是有趋势的,然后设法追随趋势。 其实最好先假定所操作的任何品种都是振盪的(振盪中当然就是高沽低进),然后考察其是否存在趋势,或者有没有发展成趋势的倾…

泛域名ov https证书1590元买一年送一月

泛域名https证书一直是域名https证书中比较受欢迎的一款数字证书产品。泛域名https证书可以同时保护主域名以及主域名下所有的子域名,为多个网站提供信息加密和身份认证服务。在证书有效期内,即使组织或者企事业单位增加多个子域名站点,也不需…

.Net利用Microsoft.Extensions.DependencyInjection配置依赖注入

一、概述 为了让接口程序更加模块化和可测试,采用依赖注入的方式调用接口方法。 二、安装Microsoft.Extensions.DependencyInjection 在NuGet里面搜索Microsoft.Extensions.DependencyInjection,并进行安装。 三、代码编写 3.1 创建Service 实现类 /*****************…

Vue自定义商品发布组件

文章目录 一、代码展示二、代码解读三、结果展示 一、代码展示 <template><div><a-popover trigger"hover" :getPopupContainer"triggerNode > {return triggerNode.parentNode || document.body;}"><template #content><d…

matlab:涉及复杂函数图像的交点求解

matlab&#xff1a;涉及复杂函数图像的交点求解 在MATLAB中求解两个图像的交点是一个常见的需求。本文将通过一个示例&#xff0c;展示如何求解两个图像的交点&#xff0c;并提供相应的MATLAB代码。 画出图像 首先&#xff0c;我们需要绘制两个图像&#xff0c;以便直观地看…

自动驾驶技术详解

&#x1f3ac;个人简介&#xff1a;一个全栈工程师的升级之路&#xff01; &#x1f4cb;个人专栏&#xff1a;自动驾驶技术 &#x1f380;CSDN主页 发狂的小花 &#x1f304;人生秘诀&#xff1a;学习的本质就是极致重复! 目录 一 自动驾驶视觉感知算法 1目标检测 1.1 两阶…

vue-electron 项目创建记录及注意事项

vue-electron 项目创建记录及注意事项 1、使用vue ui或者命令行创建vue项目 2、添加electron插件 3、安装element-plus: npm install --save element-plus 4、修改配置文件如下图: vue.config.js增加配置&#xff1a; pluginOptions:{ electronOutput: { contextIsolation…

JVM(4)

垃圾回收问题 垃圾回收算法 通过之前的学习我们可以将死亡对象标记出来了,标记出来后我们就可以进行垃圾回收操作了,在正式学习垃圾处理器之前,我们先来看一下垃圾回收器使用的几种算法. 标记-清除算法 "标记-清除"算法是基础的收集算法.算法分为"标记"…

nextjs13如何进行服务端渲染?

目录 一、创建一个新项目 二、动态获取后端数据进行服务端渲染出现的问题 三、nextjs13如何进行服务端渲染 nextjs13是nextjs的一个重大升级&#xff0c;一些原本在next12当中使用的API在nextjs13上使用十分不便。本文将着重介绍在nextjs13及以上版本当中进行服务端渲染的方…

Java进阶(锁)——锁分类总结,Java中常用的锁的介绍

目录 引出锁分类总结1、乐观锁2、悲观锁3、自旋锁4、可重入锁5、读写锁6、公平锁7、非公平锁8、共享锁9、独占锁10、重量级锁11、轻量级锁12、偏向锁13、分段锁14、互斥锁15、同步锁16、死锁17、锁粗化18、锁消除 Java中常用的锁synchronizedLock和synchronized的区别Reentrant…

web组态(BY组态)接入流程

技术文档 官网网站&#xff1a;www.hcy-soft.com 体验地址&#xff1a; www.byzt.net:60/sm 一、数据流向图及嵌入原理 数据流向 嵌入原理 二、编辑器调用业务流程图 三、集成前需要了解的 1、后台Websocket端往前台监控画面端传输数据规则 后台websocket向客户端监控画面…

视频记录仪_基于联发科MT6762的智能4G记录仪方案

智能记录仪采用联发科强劲八核处理器&#xff0c;12nm制程工艺的记录仪具便是满足这些需求的理想选择。搭载4GB32GB内存&#xff0c;并运行Android 11.0操作系统&#xff0c;这款记录仪具展现出强劲的性能表现。 首先&#xff0c;这款记录仪具具备优秀的视频录制功能。它能完整…

mysql python学习笔记

mysql 基础概念 1.一个表格一般包含一个主建 2.可有多个主见,叫组合主见 3.可以有foreign key 用于链接外部表格的主建 外键目的&#xff1a; 这个约束的目的是确保当前表中的外键列&#xff08;JNO列&#xff09;的值必须存在于另一个表&#xff08;J’表&#xff09;的主键…

kibana7.17.7 将数据导出csv文件

配置kibana文件 首先先配置kibana.yaml内容如下&#xff0c;这里假设我的服务器ip地址为192.168.130.128&#xff0c;elasticsearch的ip地址为&#xff1a;192.168.130.129:9200&#xff0c;192.168.130.130:9200&#xff1a; server.host: "192.168.130.128" serv…

【踩坑专栏】追根溯源,从Linux磁盘爆满排查故障:mycat2与navicat不兼容导致日志暴增

昨天遇到了一个比较奇怪的问题&#xff0c;就是在挂起虚拟机的时候&#xff0c;虚拟机提示我XX脚本正在运行&#xff0c;很奇怪&#xff0c;我没有运行脚本&#xff0c;为什么会提示我这个呢。今天恢复虚拟机&#xff0c;也提示了一下脚本的问题&#xff0c;而且发现Linux明显异…

尚硅谷Java数据结构--希尔排序

插入排序的问题&#x1f388;&#xff1a; arr{2,3,4,5,6,0,9,7,8}; 当0作为插入元素的时候&#xff0c;其待插入下标与原下标相差很远&#xff0c;需要进行多次比较和移动。 希尔排序则是先将下标相差一定距离gap的元素分为一组&#xff0c;进行插入排序&#xff1b;再逐渐将距…

利用 Python 抓取数据探索汽车市场趋势

一、引言 随着全球对环境保护意识的增强和技术的进步&#xff0c;新能源汽车作为一种环保、高效的交通工具&#xff0c;正逐渐受到人们的关注和青睐。在这个背景下&#xff0c;对汽车市场的数据进行分析和研究显得尤为重要。 本文将介绍如何利用 Python 编程语言&#xff0c;结…

TypeScript08:在TS中使用模块化

前言&#xff1a;tsconfig.json中的配置 一、前端领域中的模块化标准 前端领域中的模块化标准有&#xff1a; ES6、commonjs、amd、umd、system、esnext 二、 TS中如何书写模块化语句 TS 中&#xff0c;导入和导出模块&#xff0c;统一使用 ES6 的模块化标准。 myModule.ts &a…