【大模型AIGC系列课程 3-2】国产开源大模型:ChatGLM

news2024/11/25 20:28:28

1. GLM

https://arxiv.org/pdf/2103.10360.pdf
GLM是General Language Model的缩写,是一种通用的语言模型预训练框架。它的主要目标是通过自回归的空白填充来进行预训练,以解决现有预训练框架在自然语言理解(NLU)、无条件生成和有条件生成等任务中表现不佳的问题。
具体来说,GLM通过随机遮盖文本中连续的标记,并训练模型按顺序重新生成这些遮盖的部分。这种自回归的空白填充目标使得GLM能够更好地捕捉上下文中标记之间的依赖关系,并且能够处理可变长度的空白。通过添加二维位置编码和允许任意顺序预测空白,GLM改进了空白填充预训练的性能。
在这里插入图片描述

这个图示说明了GLM预训练的过程,具体解释如下:
a) 原始文本:给定一个原始文本,例如[x1, x2, x3, x4, x5, x6]。在这个例子中,我们随机选择了两个连续的词片段[x3]和[x5, x6]作为样本。
b) 替换和洗牌:在Part A中,我们将被选择的词片段替换为[M](表示遮盖)。在Part B中,我们将被选择的词片段进行洗牌,即改变它们的顺序。在这个例子中,我们将[x3]和[x5, x6]洗牌为[x5, x6]和[x3]。
c) 自回归生成:GLM使用自回归的方式生成Part B。每个词片段都以[S]作为输入的前缀,以[E]作为输出的后缀。在生成过程中,模型可以根据之前生成的词片段和Part A中的上下文来预测下一个词片段。
d) 自注意力掩码:为了限制模型的注意力范围,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/939100.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python conda实践 sanic框架gitee webhook实践

import subprocess import hmac import hashlib import base64 from sanic.response import text from sanic import Blueprint from git import Repo# 路由蓝图 hook_blue Blueprint(hook_blue)hook_blue.route(/hook/kaifa, methods["POST"]) async def kaifa(req…

【Java 中级】一文精通 Spring MVC - 数据格式化器(六)

👉博主介绍: 博主从事应用安全和大数据领域,有8年研发经验,5年面试官经验,Java技术专家,WEB架构师,阿里云专家博主,华为云云享专家,51CTO 专家博主 ⛪️ 个人社区&#x…

计算机毕设 基于机器视觉的二维码识别检测 - opencv 二维码 识别检测 机器视觉

文章目录 0 简介1 二维码检测2 算法实现流程3 特征提取4 特征分类5 后处理6 代码实现5 最后 0 简介 今天学长向大家介绍一个机器视觉的毕设项目,二维码 / 条形码检测与识别 基于机器学习的二维码识别检测 - opencv 二维码 识别检测 机器视觉 1 二维码检测 物体检…

WordPress主题Zing V2.2.1/模块化WordPress响应式通用企业商城主题

WordPress主题Zing V2.2.1,模块化WordPress响应式通用企业商城主题。 功能介绍 百度熊掌号文章实时推送、原创保护 多设备支持自适应布局,支持电脑、Pad、手机以及各种浏览器 SEO优化首页、文章、页面、分类均支持自定义标题、关键字和描述 速度优化…

ios ipa包上传需要什么工具

目录 ios ipa包上传需要什么工具 前言 一、IPA包的原理 二、IPA包上传的步骤 1.注册开发者账号 2.apk软件制作工具创建应用程序 3.构建应用程序 4.生成证书和配置文件 5.打包IPA包 6.上传IPA包 三、总结 前言 iOS IPA包是iOS应用程序的安装包,可以通过iT…

高忆管理:美股盘中狂泻600点,美联储释放重磅信号!

隔夜美股商场,上演大跳水。 当地时间8月24日,美股三大指数团体大跳水,道指跌1.08%,纳指大跌1.87%,标普500指数跌1.35%。标普、纳指均创惠誉下调美国主权评级以来最差单日体现,道指盘中由最高34694点跌到了…

freertos之队列集

队列集就是队列的集合 队列集的长度所包含队列的长度之和 实验 创建两个队列和一个队列集,并把队列添加到队列集,创建3个任务,其中两个任务往队列存数据,另一个任务通过队列集来获取数据。 实验结果:

星云日记是什么?流量共享模式特点

星云日记是什么?流量共享,一键解决卖货难题 星云日记,即将来袭,竞拍抢购模式,一键转卖,24小时转卖成功 顾客共享,资源共享,利润共享无需找顾客,一键转卖24H结算,别光盯着大饼,先解决生活问题。…

微信签到抽奖活动策划指南,打造成功的营销活动

在如今竞争激烈的市场环境下,吸引用户参与活动成为了企业吸粉、增加品牌知名度的重要手段之一。签到抽奖活动作为一种简单而又有趣的方式,能够吸引更多用户的参与。那么,制作一个吸引人的签到抽奖活动需要几个步骤呢?下面我们一起…

聚观早报|闻泰科技上半年净利润12.58亿;馥逸医疗完成A轮融资

【聚观365】8月27日消息 闻泰科技2023上半年净利润12.58亿 馥逸医疗完成A轮融资 东方甄选转型直播电商成功 AI牙齿美白公司白里挑一完成千万元天使轮融资 特斯拉新款Model 3全面升级 闻泰科技上半年净利润12.58亿 闻泰科技发布2023年半年报。报告期内,闻泰科技…

img引入的svg图片,悬浮时怎么修改颜色?

实现效果:鼠标悬浮在这一行,让这行的文字和svg图片颜色发生变化。 因为是用img标签引入页面,使用fill属性是无效的。 css核心代码: &:active,&:hover {transform: scale(0.98);img{filter: drop-shadow(#409eff 50px 0);…

如何在一个有500台PC以上的局域网配置IP、子网掩码

上午好,我的网工朋友。 IP地址是一种在Internet上的给主机编址的方式,它是IP协议提供的一种统一的地址格式。 它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。 现在是互联网大行的时代,所以…

网络中的问题2

距离-向量算法的具体实现 每个routerY的路由表表项 involve<目的网络N&#xff0c;距离d&#xff0c;下一跳X> 对邻居X发来的报文,先把下一跳改为X,再把距离1,if original route table doesn’t involve N,add this item&#xff1b; else if original table’s relate…

No121.精选前端面试题,享受每天的挑战和学习

文章目录 1、flex布局2、position定位&#xff1a;fixed、relative和absoluted区别3、js数据类型&#xff0c;Symbol是什么、有什么用4、ES6新增哪些API5、TCP四次挥手6、localStorage和sessionStorage&#xff0c;存储大小7、跨域怎么解决&#xff08;开发环境和生成环境&…

开学数码产品必备好物,有什么值得买的数码产品推荐?

​又准备到了新学期开学季&#xff0c;很多新生都会选择在这个时候购买新装备。不过&#xff0c;种类繁多的数码产品很容易让人挑花了眼。今天来分享几款非常实用的数码好物给大家&#xff0c;让你的新学期焕然一新&#xff01; Top1&#xff1a;南卡00压蓝牙耳机 数码产品绝对…

灵明光子正式发布超高分辨率纯固态激光雷达SPAD芯片ADS6311

SPADIS面阵型ADS6311芯片 广泛适用于车载、机器人等纯固态激光雷达领域 作为SPAD dToF行业的一家领军级企业,灵明光子在2023年迎来了众多里程碑式的突破,获得包括成功通过AEC-Q102 Grade 1车规级认证,完成混合固态激光雷达接收端的SiPM芯片产能爬坡和量产出货,被国家工信部…

十人拼购消费全返,全民拼购模式

传统的消费模式已经满足不了消费者们的消费心理&#xff0c;企业要去琢磨大众的消费心理&#xff0c;对于消费者来说&#xff0c;实际性的购物是必须的&#xff0c;但是平台商家吸引的亮点莫过于就是消费返利&#xff0c;不少商城平台包括店面都存在这种消费返利的形式&#xf…

在 Python 中构建卷积神经网络; 从 0 到 9 的手绘数字的灰度图像预测数字

一、说明 为了预测从0到9的数字&#xff0c;我选择了一个基于著名的Kaggle的MNIST数据集的数据集。数据集包含从 <0> 到 <9> 的手绘图数字的灰度图像。在本文中&#xff0c;我将根据像素数据&#xff08;即数值数据&#xff09;和卷积神经网络预测数字。 二、 卷积…

储能辅助电力系统调峰的容量需求研究(matlab代码)

目录 1 主要内容 2 部分代码 3 程序结果 4 下载链接 1 主要内容 该程序参考文献《储能辅助电力系统调峰的容量需求研究》&#xff0c;是一个很常规很经典的matlab优化代码&#xff0c;主要是对火电、风电和储能等电力设备主体进行优化调度&#xff0c;在调峰能力达不到时采…

一文便知 GO 中mongodb 的安装与使用

MONGDB 安装与使用 咱们来回顾一下上次分享的内容&#xff1a; 如何使用log 包log 包原理和具体实现自定义日志 要是对 GO 的日志包还有点兴趣的话&#xff0c;可以查看文章 GO的日志怎么玩 ? 今天咱们来玩个简单的 mongodb 的安装和使用 MONGODB介绍 MongoDB 是一个基于…