AI大模型开发架构设计(3)——如何打造自己的大模型

news2025/2/26 3:49:04

文章目录

    • 如何打造自己的大模型
      • 1 新时代职场人应用AIGC的5重境界
      • 2 人人需要掌握的大模型原理
        • 职场人都能听懂的大语音模型的训练过程
        • 职场人都能听得懂的大语言模型的Transformer推理过程
      • 3 如何构建自己的大模型
        • 需要具备三个方面的能力
        • LangChain是什么?
        • LangChain主要功能
        • LangChain核心组成

如何打造自己的大模型

1 新时代职场人应用AIGC的5重境界

  • 第一、简单对话 + Ctrl-C/V 结果:人人都行
  • 第二、Prompt Engineering:系统掌握 Prompt 提示词技能,赋能工作真正提效
  • 第三、把AIGC融入业务流程,指挥AIGC做复杂任务:掌握好 AIGC 技能、真正懂业务领域知识
  • 第四、拥有自己的大模型:懂大模型原理、基于开源大模型微调(Fine-tune)、有行业数据壁垒
  • 第五、参与设计训练大模型:OpenAI等大模型公司

思考:自己处于哪种境界?

2 人人需要掌握的大模型原理

职场人都能听懂的大语音模型的训练过程

image.png

  • 第一阶段:传统的有监督训练
  • 第二阶段:奖励模型
  • 第三阶段:运用奖励模型,一问一回答一打分,不断进行反馈迭代强化学习
职场人都能听得懂的大语言模型的Transformer推理过程
  • Transformer:在 Transformer 之前,最大的问题就是遗忘(记不住上下文信息)

image.png

  • Transformer:通过**注意力机制(Attention)**解决遗忘问题
    • The:第一个,前面没有关联
    • FBI:前面会关联 The
    • is:前面会关联 FBI
    • chasing:前面会关联 FBI、is

image.png

  • Transformer:整个流程设计(大模型的核心)——2017年提出

image.png

  • Transformer:Encoder 将输入“序列”中的信息提取出来

image.png

  • Transformer:Encoder-Attention 将重要信息提取出来

image.png

  • Transformer:Encoder-Attention 将重要信息提取出来,会有一些更复杂的计算细节

image.png

3 如何构建自己的大模型

需要具备三个方面的能力
  • Prompt Engineer(提示词工程)
  • LangChain(一个框架的名字)
  • Fine-tuning(微调)
LangChain是什么?
  • 面向大模型的开发框架
  • 简单实现复杂功能的 AIGC 应用
  • 多组件封装

image.png

  • LangChain 推荐资料:https://wx.zsxq.com/dweb2/index/topic_detail/211842521158511
LangChain主要功能

image.png

LangChain核心组成
  • 组件
  • 封装
  • 模块

image.png

  • LangChain 核心组成:I/O模块
    • Prompts:主要管理、协助构建送入 Model 的输入
    • Language Modes:用何种 Model
    • Output parsers:解析输出结果

image.png

  • LangChain 核心组成:I/O模块流程
    • Prompts:归一化
    • Language Modes:预测
    • Output parsers:归一化

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块
    • Source:支持各种异构数据源
    • Load:加载
    • Transform:变换
    • Embed:向量化
    • Store:存储向量数据库
    • Retrieve:检索

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Load

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Transform

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Embed

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Embed-相识度核心原理(“向量”距离)

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Vector Store

image.png

image.png

  • LangChain 核心组成:记忆(Memory)模块,针对多轮对话强相关

image.png

image.png

image.png

image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1401213.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【精选】中间件 tomcat漏洞复现

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【python】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收藏…

在腾讯云买了云服务器和域名如何快速建网站?

使用腾讯云服务器搭建网站全流程,包括轻量应用服务器和云服务器CVM建站教程,轻量可以使用应用镜像一键建站,云服务器CVM可以通过安装宝塔面板的方式来搭建网站,腾讯云服务器网txyfwq.com分享使用腾讯云服务器建站教程,…

基于SQL的可观测性现状观察

本文字数:8975;估计阅读时间:23 分钟 作者:Ryadh Dahimene 审校:庄晓东(魏庄) 本文在公众号【ClickHouseInc】首发 1375年的加泰罗尼亚地图所展示的地中海地区。通商媒介语(Lingua F…

深度学习记录--正则化(regularization)

什么是正则化? 正则化(regularization)是一种实用的减少方差(variance)的方法,也即避免过度拟合 几种正则化的方法 L2正则化 又被称为权重衰减(weight dacay) 在成本函数中加上正则项: 其中 由于在w的更新过程中会递减,即权…

STL---Stack和Queue

一、stack的介绍和使用 (1)介绍 翻译: (1)stack是一种容器适配器,专门用在具有后进先出操作的上下文环境中,其删除只能从容器的一端进行元素的插入与提取操作。 (2) stack是作为容器…

【2020】百度校招Java研发工程师笔试卷(第二批)算法题

贴一下我去年9月份写的博客 三道编程题,一道数学题,两道图论,哎嘿嘿,我就是不会做,哎嘿嘿,哭了。。。 一.最小值 牛牛给度度熊出了一个数学题,牛牛给定数字n,m,k,希望度度熊能找到…

【小沐学GIS】基于C#绘制三维数字地球Earth(OpenGL)

🍺三维数字地球系列相关文章如下🍺:1【小沐学GIS】基于C绘制三维数字地球Earth(OpenGL、glfw、glut)第一期2【小沐学GIS】基于C绘制三维数字地球Earth(OpenGL、glfw、glut)第二期3【小沐学GIS】…

【二叉树练习2】

文章目录 判断是否是完全二叉树找出p和q的最近的公共祖先非递归实现前序遍历非递归实现中序遍历非递归实现后序遍历 判断是否是完全二叉树 boolean isCompleteTree(TreeNode root){if (root null){return true;}//创建队列Queue<TreeNode> queue new LinkedList<>…

文心一言 VS 讯飞星火 VS chatgpt (183)-- 算法导论13.4 7题

七、用go语言&#xff0c;假设用 RB-INSERT 将一个结点 x 插入一棵红黑树&#xff0c;紧接着又用 RB-DELETE 将它从树中删除。结果的红黑树与初始的红黑树是否一样&#xff1f;证明你的答案。 文心一言&#xff1a; 首先&#xff0c;我们需要明确RB-INSERT和RB-DELETE的基本操…

“gradle project sync failed”

很久没打开AndroidStudio了&#xff0c;打开电脑发现这个软件都没了。重新安装后创建项目不成功&#xff0c;就提示了这个错误。 错误原因 “gradle project sync failed”&#xff1a;gradle没有配置成功。在安卓项目下找到目标文件&#xff1a;gradle --> wrapper -->…

机械设计-哈工大课程学习-螺旋传动

二、摩擦类型 1、静态摩擦&#xff1a;这是身体静止时所经历的摩擦。换句话说&#xff0c;就是身体有运动倾向时的摩擦力。 2、动态摩擦&#xff1a;这是身体在运动时所经历的摩擦。也称为动摩擦。动摩擦有以下两种类型&#xff1a; ①滑动摩擦&#xff1a;一个物体在另一个…

赛车游戏简单单车C语言版

#include<stdio.h> #include<easyx.h> #include<time.h>#define WIDTH 512 #define HEIGHT 768//定义一个汽车类 struct FCar {//坐标float x, y;// 汽车种类int type;//汽车速度float speed; };//定义全局变量 图片坐标 IMAGE BG_IMG; //背景图片坐标 float…

SV学习——数据类型(1)

文章目录 1. 内建数据类型2. 用户自定义3. 枚举类型 1. 内建数据类型 SV中引入新的数据类型logic&#xff0c;SV作为侧重于验证的语言&#xff0c;并不十分关切logic对应的逻辑应该被综合位寄存器还是线网&#xff0c;因为logic被使用的场景如果是验证环境&#xff0c;那么它只…

AI对比:ChatGPT与文心一言的异同与未来

文章目录 &#x1f4d1;前言一、ChatGPT和文心一言概述1.1 ChatGPT1.2 文心一言 二、ChatGPT和文心一言比较2.1 训练数据与知识储备2.2 语义理解与生成能力2.2 应用场景与商业化探索 三、未来展望3.1 模型规模与参数数量不断增加3.2 多模态交互成为主流3.3 知识图谱与大模型的结…

如何在 Ubuntu / Raspbian 上安装 MariaDB

Raspberry Pi OS&#xff08;原为Raspbian&#xff09;是为树莓派基于Debian开发的操作系统。 从2015年起&#xff0c;树莓派基金会正式将其作为树莓派的官方操作系统。 Raspbian是由Mike Thompson和Peter Green创建的一个独立项目。第一个版本于2012年6月发布&#xff0c;至…

Unity中实现捏脸系统

前言 目前市面上常见的捏脸一般是基于BlendShapes和控制骨骼点坐标两种方案实现的。后者能够控制的精细程度更高&#xff0c;同时使用BlendShapes来控制表情。 控制骨骼点坐标 比如找到控制鼻子的骨骼节点修改localScale缩放&#xff0c;调节鼻子大小。 BlendShapes控制表…

modelscope下载模型

# 私有模型下载&#xff0c;前提是您有响应模型权限 方法1 git lfs install git clone http://oauth2:your_git_tokenwww.modelscope.cn/<namespace>/<model-name>.git 如何获取git token 用您的账号登录https://www.modelscope.cn &#xff0c;在个人中心->访…

10本审稿及出版效率均较好的医学SCI期刊参数分享!

常笑医学整理了适合医务工作者进行论文投稿的医学SCI期刊&#xff0c; 审稿及出版效率均较好&#xff0c;附期刊详细参数&#xff0c;供大家参考。 1.CLINICAL CHEMISTRY AND LABORATORY MEDICINE&#xff08;临床化学与实验医学&#xff09; &#xff08;详细投稿信息请点击刊…

【Java】Maven的安装与配置

初识Maven Maven是专门用于管理和构建Java项目的工具&#xff0c;它的主要功能有&#xff1a; 提供了一套标准化的项目结构 提供了一套标准化的构建流程&#xff08;编译&#xff0c;测试&#xff0c;打包&#xff0c;发布……&#xff09; 提供了一套依赖管理机制 标准化的…

解决springboot+mybatisplus返回时间格式带T

原因&#xff1a;我service实现类的代码是 Overridepublic Map<String, Object> queryDictPage(Map<String, Object> queryMap) {Map<String,Object> map new HashMap<>();QueryWrapper<Dict> wrapper new QueryWrapper<>(); // …