大白话!大模型(LLMs)私有化的三种方式:Prompts、Embeddings、Fine-tuning

news2024/11/15 9:37:28

私有化大模型的三种方式

随着我们使用大模型的深入呢,我们会发现这样一个现象,我们正常情况下问大模型的问题,会得到一个非常普适的回答,就是大模型会根据自己的训练的这个过往的一些知识的积累,然后告诉我们他认为最好的一个答案,但是如果我们问到一些非常具体的针对啊我们自己生活或工作的一些问题,比如说一个文档,或者说公司里边的一些情况的时候,这个时候呢,大模型的回答的这个就不会包括这部分知识。

那如何做这样的定制呢?我们今天就讲这个这个话题,通常来讲有三种办法,第一个办法呢,就是提示工程 prompt engineering,这是一种通过设计特定的输入提示来引导模型生成我们期望的输出的办法。第二种呢,叫做知识库的嵌入,叫Knowledge based embeddings,指的是结合模型与外部知识库,使模型在生成答案的时候呢,可以引用这些外部的知识。第三种呢,就是fine-Tuning,微调,这是在特定数据集上对预先训练的模型进行额外的训练,使其更适应特定任务或者领域。

这么讲起来呢,可能有点难理解,我们举一个例子来说明,假设一个大学生刚毕业了,他具有经过了这20多年的学习,他具有了不错的学术背景和理论的知识,然后他现在要去工作。但是在面临实际工作的时候呢,它必须要需要一些适应和调整,对吧?所以呢,提示工程prompt engineer相当于什么呢?相当于他的领导口头布置了一个任务,然后这个大学生呢,就基于自己的知识和经验,按照任务要求进行操作。第二种,就知识库嵌入,相当于什么呢?相当于这个学生遇到了一些问题啊,然后他的领导给一本操作手册、一本字典,然后让他在操作的时候,这个学生就可以去查阅啊,相当于引用了外部知识库来增强他的输出。

那第三种呢,fine-tuning像什么呢?就像是一个学生在刚开始工作的时候,他不是报到的第一天就去工作的,他是先经呃接受了两个月的上岗前的培训,可能有公司的这个企业的一些制度啊,企业的文化呀。工作流程啊,过往的一些操作指南啊等等,让它更适应具体的工作环境和要求。

所以这三种方式的优缺点是什么呢?我们很快的讲一下,第一种提示工程,prompt engineering来讲,它的最大的优点在于快速实现,直接针对特定的需求,然后这个学生就能够迅速的得到结果,但缺点就是有可能需要多次尝试才能得到最佳答案,需要多次进行尝试,这个方法也不适用所有的问题,特别是对复杂的任务而言,这种方法可能会失效,因为提供的一些背景知识就已经超出了大模型问答上下文长度限制。

第二知识库嵌入,它的优点是增加了模型的深度和广度,使其能够更处理更加复杂和特定的问题,就好像刚才讲,像这个学生有一个操作手册,他可以随时查阅。但这个缺点在于什么呢?在于啊,整合和维护知识库需要额外的时间和资源啊,这不是说它就一直在那里的,要进行对它进行向量化的一些操作,然后呢,需要确保啊,同时需要确保知识库的准确性和及时性,随时需要更新的。

最后一个微调,它的优点是针对特定任务啊,或者领域优化模型的性能,使其更加的专业和适应,就好像刚才讲上岗前的培训之后,这个学生就会更加胜任某一岗位,但是他的缺点呢,就是需要大量的标记数据啊,可能会导致一种叫做过拟合的情况发生,就好像这个学生,只针对一个小领域进行培训,可能就会失去了对没有培训过的其他领域的一个灵活性,可以理解为类似偏科。

所以做一个简单的总结,这个大学生可以接受领导的口头任务,也就是“提示工程”,他就去做了,第二种方式这个学生,可以拿到一个手册,然后在不会的时候去查阅手册,再去再去做,这叫做知识库的嵌入,第三个微调,就是他进行了一个上岗前的培训,一个月的培训,然后再来进行适应,比上岗前肯定能更适应工作,所以就是这样一个例子,帮助大家去进行一个理解。

什么是LLMOps?

对于企业来说,肯定是希望大模型不仅具备一定的通用能力,还希望更懂自身企业的业务场景、产品矩阵、甚至是将企业已有的各场景管理系统(ERP、Sap、OA、电商、仓储、物流、配送、客服、工单、IM等)进行打通、串联以完成更复杂的任务,更加降本增效。

那么就意味着,企业需要一个可以帮自己将大模型进行私有化部署的平台工具,这个平台工具可以结合企业生产经营场景,将企业内部多年沉淀的管理、生产、销售、运营、客服等等所有经验统统交由大模型进行学习、领悟、融汇贯通,并且再合适的场景和时机为员工和管理者以文字、语音、视频、动画等形式,提供可靠、准确的建议和指导,并且在必要的时候,可以替员工代劳有些机械、繁重、重复的操作。那么这个平台就是LLMOps!

但是企业基于大语言模型进行以上场景需求的应用开发,过程如下:

  1. 数据准备:手动收集和预处理数据,可能涉及到复杂的数据清洗和标注工作,需要编写较多代码。;

  2. Prompt Engineering:通过调用 大模型提供的API 或 Playground 进行;

  3. 数据准备与嵌入:编写代码实现长文本数据处理、嵌入;

  4. 应用日志与分析:编写代码记录日志,访问数据库查看;

  5. 数据分析与微调:处理微调数据准备和训练过程;

  6. AI 插件开发与集成:编写代码创建、集成 AI 插件。

以下界面就是一个不错的LLMOps的演示系统截图:

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

-END-


👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1678861.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

海外盲盒系统开发,开拓全球盲盒市场

盲盒作为经久不衰的行业,市场发展空间不断扩大。近几年,盲盒出海成为了我国盲盒发展的新赛道,各个盲盒企业更是纷纷摩拳擦掌,开拓海外市场,我国盲盒正在全世界范围内实现多元化发展。此外,我国是世界上有名…

光伏行业该如何起步?

随着全球对可再生能源的需求日益增长,光伏行业作为其中的佼佼者,正迎来前所未有的发展机遇。然而,对于新进入者或希望在这一领域有所建树的企业来说,如何起步并稳健发展是一个值得深思的问题。以下是一些关于光伏行业起步的建议。…

AniPortrait详细讲解以及完整搭建流程(有问题留言)

AniPortrait是一款真实感人像动画的音频驱动合成的AI程序。 下面是它的github源码: GitHub - Zejun-Yang/AniPortrait: AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait AnimationAniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animati…

[Vs2019报错找不到服务实例的解决方案]

计算机疑难杂症记录与分享004 Vs2019报错找不到服务实例的解决方案1、问题现象1.1、问题一:打开vs2019打开项目工程文件,直接弹窗报错1.2、问题二:能打开工程了。识别项目文件不兼容问题。 2、问题原因3、问题一的解决3.1、方法一(亲测无效)3…

Java的response返回Json格式

问题 今天开发过程中,写了个拦截器,对于所以请求进行一个token的工作,对于不合标准的token返回错误,在网上找了个拦截器进行二次开发。 package com.maizhiyu.yzt.handle;import org.springframework.beans.factory.annotation.…

Python数据分析常用模块的介绍与使用

Python数据分析模块 前言一、Numpy模块Numpy介绍Numpy的使用Numpy生成数组ndarrayarray生成数组arange生成数组random生成数组其他示例 关于randint示例1示例2 关于rand Numpy数组统计方法示例 二、Pandas模块pandas介绍Series示例 DataFrame示例 三、其他模块Matplotlib/Seabo…

通过单总线实现单片机之间的数据传输

单总线、没有时钟线的通信时,不能使用简单的高低电平来通信,因为接收方不知道此时发送的数据是第几位数据,容易造成错乱。 因此在使用一根线对外传输数据时,需要自定义一个通信协议,它至少要包含格式头数据&#xff0c…

什么是直接内存(NIO)

直接内存不受 JVM 内存回收管理,是虚拟机的系统内存,常见于 NIO 操作时,用于数据 缓冲区,分配回收成本较高,但读写性能高,不受 JVM 内存回收管理。 举例 当上传一个较大文件(200M)…

python REST 请求验证

REST 请求验证 在Python中,可以使用cerberus库来进行REST请求的验证。以下是一个简单的示例,演示如何使用cerberus进行请求数据的验证。 首先,安装cerberus库: pip install cerberus # 安装cerberus库 -- Anaconda 环境下安装 …

SQL常用函数

一、日期相关函数 1、CURDATE() / CURRENT_DATE 返回当前日期 2、CURRENT_TIME()/CURTIME() 返回当前时间 3、CURRENT_TIMESTAMP 返回当前日期时间 4、DATE()从日期或日期时间表达式中提取日期值 5、DATEDIFF(d1,d2)计算日期 d1->d2 之间相隔的天数 6、DATE_FORMAT按表达式…

【C++】从零开始构建二叉搜索树

送给大家一句话: 我们始终有选择的自由。选错了,只要真诚的反思,真诚面对,也随时有机会修正错误和选择。 – 《奇迹男孩(电影)》 💻💻💻💻💻💻💻…

Google I/O 2024:探索未来AI技术的无限可能

近日,Google I/O 2024大会圆满落幕,带给我们一场关于人工智能的盛宴。在这场大会上,Google推出了一系列令人激动的AI新功能和工具,让我们得以一窥未来的科技发展。今天,就让我来为大家总结一下这些亮点吧! …

客观需求验证的常见5大步骤(实施版)

我们在挖掘用户需求时,往往容易犯伪需求或需求错位等问题,因此需要进行客观需求验证。通过客观的验证,我们可以有效减少主观判断误差问题,确保需求的准确性,从而降低需求变更和项目风险的概率,减少开发成本…

Linux bc命令(bc指令)(基本计算器)(任意精度计算语言:支持浮点数运算、变量赋值和自定义函数等)

文章目录 bc命令文档英文中文 Linux bc 命令详解bc 命令的基本用法启动 bc 环境进行基本计算退出 bc bc 中的数学功能执行高级数学计算平方根和指数函数对数函数 处理精度问题 变量和数组变量赋值和使用数组的使用 创建和使用自定义函数 bc 命令的高级用法在脚本中使用 bc基本脚…

我与C++的爱恋:string类的常见接口函数

​ ​ 🔥个人主页:guoguoqiang. 🔥专栏:我与C的爱恋 朋友们大家好啊,本节我们来到STL内容的第一部分:string类接口函数的介绍 ​ ​ 1.string类的认识 给大家分享一个c文档 https://legacy.cplusplus.…

Java | 增强for底层工作机制

✍🏼作者:周棋洛,bilidown开发者。 ♉星座:金牛座 🏠主页:我的个人网站 🌐关键:Java 增强for 工作机制 目录 引言增强for循环语法增强for工作机制探究简单总结1.对于实现了Iterable接…

LeetCode算法题:11. 盛最多水的容器(Java)(双指针问题总结)

给定一个长度为 n 的整数数组 height 。有 n 条垂线&#xff0c;第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线&#xff0c;使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容器可以储存的最大水量。 提示&#xff1a; n height.length2 <…

寻求发展+兼顾陪读|企业高管赴美国乔治梅森大学做访问学者

E经理拟去美国访学&#xff0c;想达到3个目的&#xff1a;结合本专业方向&#xff0c;扩展至跨学科研究领域&#xff1b;考察市场&#xff0c;寻求新的发展契机&#xff1b;携孩子出国读书&#xff0c;兼顾陪读&#xff0c;并希望尽早出国。最终我们为其落实的乔治梅森大学访问…

AI预测体彩排3采取878定位大底=23策略+杀断组+杀组选+杀和尾+杀和值012缩水测试5月15日预测第1弹

昨天与一位玩排3的彩友通过视频直播的形式聊了下&#xff0c;受益匪浅&#xff0c;给我提供了一些比较有价值的建议&#xff0c;比如&#xff0c;对于878的定位策略&#xff0c;方向是没问题的&#xff0c;但是8783的话&#xff0c;还是缺乏一定的命中率&#xff0c;如果87823&…

做私域,该如何从公域向私域引流?

说到私域运营&#xff0c;很多人首先就会想到&#xff1a;私域流量。企业做私域&#xff0c;流量从哪来&#xff1f;该怎样去引流&#xff1f;又该如何保障私域流量的质量等一系列问题&#xff0c;都需要企业一一解决。所以&#xff0c;今天&#xff0c;我们就来探讨一下&#…