LLM - 大语言模型(LLM) 概述

news2025/1/19 14:12:55

欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/136617643

LLM

大语言模型(LLM, Large Language Model)的发展和应用是一个非常广泛的领域,涉及从早期的统计模型到现代基于深度学习的模型。在自然语言处理领域的应用非常广泛,包括但不限于聊天机器人、内容生成、情感分析、自动摘要、问答系统等。强大的文本生成能力,使其在内容创作领域具有巨大潜力,可以用于撰写文章、创作诗歌、生成新闻报道等。也可以为教育提供丰富的资源和工具,如自动评分、个性化学习辅导等,还可以用于构建智能客服系统,提高客户服务的响应速度和准确性。

以下是语言模型发展的4个阶段:

  1. 早期发展: 最初的语言模型基于统计方法和简单的神经网络,如循环神经网络(RNN)。这些模型在文本生成、机器翻译和语音识别等领域有所应用。
  2. Transformer架构: 随着Transformer架构的提出,语言取得了重大进展。Transformer提供了一种有效的方法来处理长距离依赖问题,并且在处理大量数据时表现出色。
  3. 预训练-微调范式: 研究者提出了预训练-微调(Pretraining-Finetuning)范式,通过在大量无标签数据上预训练模型,然后在特定任务上进行微调,以提高模型在特定任务上的表现。
  4. 多模态: 近年来,多模态大语言模型成为研究热点,这类模型不仅处理文本,还能理解图像和声音等其他类型的数据。

总的来说,大语言模型的发展推动了人工智能在理解和生成自然语言方面的能力,为各种应用提供了强大的支持。

LLM


1. 大语言模型概念

概念

世界科学发展的5个范式是对科学研究方法演变的概括,每个范式代表了一种独特的研究方法和科学理解的方式,即:

  1. 经验范式:这是最古老的科学范式,依赖于直接观察自然现象并从中获取知识。不依赖于复杂的理论,而是基于实验和经验的积累。
  2. 理论范式:随着数学和逻辑的发展,科学家开始使用理论模型来解释观察到的现象。这个范式包括了像牛顿运动定律这样的经典理论。
  3. 计算范式:计算机的出现使得科学家能够解决以前无法手工计算的复杂问题。这个范式依赖于数值模拟和计算机仿真。
  4. 数据范式:在大数据时代,科学研究开始依赖于收集、存储和分析大量数据。这个范式利用统计和机器学习方法来从数据中提取知识。
  5. 科学智能范式:这是最新的范式,结合了人工智能技术,特别是深度学习,来加速科学发现。利用AI来模拟和预测复杂系统的行为,有时甚至可以发现新的科学规律。

这些范式并不是相互排斥的,而是相辅相成,共同推动科学进步。


2. 大语言模型发展

Development
大语言模型的三种主要架构,即Encoder-Only、Decoder-Only、Encoder-Decoder,各有其特点和应用场景:

  1. Encoder-Only架构:
    • 这种架构专注于输入文本的理解,通常用于分类、实体识别或其他需要理解文本含义的任务。
    • 通过编码器处理输入文本,提取特征,然后用于下游任务。
    • 例如,BERT(Bidirectional Encoder Representations from Transformers)就是一个典型的Encoder-Only模型。
  2. Decoder-Only架构:
    • Decoder-Only架构专注于生成文本,适用于语言生成任务,如文本续写、创作等。
    • 通过解码器从给定的上下文中生成下一个单词或序列。
    • GPT(Generative Pretrained Transformer)系列模型是Decoder-Only架构的代表。
  3. Encoder-Decoder架构:
    • 这种架构结合了编码器和解码器的优点,能够理解输入文本并生成相应的输出。
    • 通常用于需要理解和生成文本的任务,如机器翻译、文本摘要等。
    • GLM(General Language Model)模型就是一个典型的Encoder-Decoder架构。

每种架构都有其独特的优势。


3. 大语言模型构建

构建流程

构建大型语言模型(LLM)的过程通常包括以下4个步骤:

  1. 预训练(Pretraining): 在这一阶段,模型在大规模的数据集上进行训练,以学习语言的基本规则和模式。这些数据集通常包含了广泛的主题和语言风格。
  2. 有监督微调(Supervised Fine Tuning, SFT): 预训练完成后,模型会在特定任务的数据集上进行微调。这些数据集是有标签的,即每个输入数据都有一个正确的输出,模型通过这些数据学习执行特定的任务。
  3. 奖励建模(Reward Modeling): 在这个阶段,模型会学习如何根据给定的奖励信号来优化其行为。这通常涉及到从人类反馈中学习,以便模型能够更好地满足用户的需求。
  4. 强化学习(Reinforcement Learning, RL): 最后,模型通过强化学习进一步优化,这是一种让模型通过试错来学习的方法。模型会在模拟环境中进行实验,根据其行为的结果来调整策略,以最大化奖励。

这个流程是迭代的,模型可能会经过多轮的预训练、微调和优化,以不断提高其性能和适应性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1518573.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

获取淘宝商品详情API数据指南(item_get-获得淘宝商品详情)

获取淘宝商品详情API数据是一个复杂的过程,涉及到多个步骤和可能的权限问题。以下是一个基本的指南,帮助你了解如何使用item_get接口获取淘宝商品详情。 1. 注册淘宝开放平台账号 首先,你需要在淘宝开放平台注册一个账号。这是获取API权限和…

【Java 并发】AbstractQueuedSynchronizer

1 AQS 简介 在同步组件的实现中, AQS 是核心部分, 同步组件的实现者通过使用 AQS 提供的模板方法实现同步组件语义。 AQS 则实现了对同步状态的管理, 以及对阻塞线程进行排队, 等待通知等一些底层的实现处理。 AQS 的核心也包括了这些方面: 同步队列, 独占式锁的获取和释放, 共…

数据结构之链式二叉树续

1.获取叶节点个数 获取叶子结点个数,我们这里也用递归的方法 利用分治思想去解决这个问题 ●代码思想: 1. 当遇到空树或者遇到空的节点时,也就是说这是的叶子为NULL,这是我们返回0 2. 当遇到左节点或者右节点为空&#xff0c…

精酿啤酒与咖喱饭的异国风味

当醇厚的Fendi Club啤酒与香浓的咖喱饭相遇,一场味蕾的异国之旅就此展开。Fendi Club啤酒以其与众不同的麦香和细腻的泡沫,为咖喱饭增添了别样的风味,而咖喱饭的香辣与丰富口感,又为啤酒带来了更多的层次感。 Fendi Club啤酒&…

docker的常用指令

docker的常用指令 从docker镜像仓库,搜索所有和mysql有关的镜像 docker search mysql 从docker仓库拉取mysql docker pull mysql这里的mysql是指使用search搜索出来的所有容器的NAME 如果和我一样遇到以下问题: 我可以登录阿里云的官网,找…

点成分享 | 了解您的健康指标:血细胞沉降率(ESR)

一、背景介绍 当我们在体检或进行临床血液检验时,时常会在检验单上看到这样一个指标:ESR。 有时检验单上只有一个简单的箭头,那么这个结果代表什么含义呢?这个指标又能如何反映我们的健康状况呢? 今天点成生物就带大…

Mysql 无法启动,mysql-bin.日志丢失删除处理

在linux操作系统中,当mysql无法启动时候,先看日志 2024-03-15T05:20:16.352075Z 0 [Warning] [MY-000081] [Server] option max_allowed_packet: unsigned value 107374182400 adjusted to 1073741824. 2024-03-15T05:20:16.352156Z 0 [Warning] [MY-010…

三种方式使用纯 CSS 实现星级评分

本文介绍三种使用纯 CSS 实现星级评分的方式。每种都值得细品一番~ 五角星取自 Element Plus 的 svg 资源 <svg xmlns"http://www.w3.org/2000/svg" viewBox"0 0 1024 1024" style""><pathfill"currentColor"d"M283.84 …

ctfshow-XXE(web373-web378)

目录 XXE&#xff08;外部实体注入攻击&#xff09; web373 web374 web375 web376 web377 web378 知识点 XXE&#xff08;外部实体注入攻击&#xff09; XXE这几关有个前提flag在根目录下文件名为flag web373 <?php error_reporting(0); libxml_disable_entity_…

定制红酒:定制流程中的专业建议与指导,帮助客户做出理想选择

在云仓酒庄洒派&#xff0c;云仓酒庄洒派深知消费者在定制红酒时可能会面临诸多选择和困惑。因此&#xff0c;云仓酒庄洒派提供专业的建议和指导&#xff0c;帮助消费者在定制流程中做出理想选择。 云仓酒庄洒派的专业团队会为消费者提供红酒品种和产区的举荐。云仓酒庄洒派会根…

基于udp协议的网络通信(windows客户端版+简易聊天室版),重定向到终端

目录 和windows通信 引入 思路 WSADATA 代码 运行情况 简单的聊天室 思路 重定向 代码 terminal.hpp -- 重定向函数 服务端 客户端 运行情况 和windows通信 引入 linux和windows都需要联网,虽然他们系统设计不同,但网络部分一定是相同的,所以套接字也是一样的 这…

Diffblue生成单元测试

什么是Diffblue Diffblue Cover 是一个强化学习 AI 平台&#xff0c;可自动编写全面的、类似人类的 Java 单元测试&#xff0c;从而节省开发人员时间、提高测试覆盖率并降低回归风险。Cover 以 IntelliJ IDE 插件&#xff08;Cover Plugin&#xff09;、CLI 应用程序&#xff…

中等职业学校人工智能技术与应用(710212)专业解决方案

一、专业背景 1.1人工智能确立为国家战略 近年来&#xff0c;人工智能技术取得了显著进展&#xff0c;不仅在理论层面有所突破&#xff0c;更在实际应用中展现出强大的潜力和价值。其发展趋势日益明显&#xff0c;展现出多方面的特点。“深度学习”与“大数据”的结合成为当前…

QT信号与槽实现方式

1、第一种实现方式 在QT开发工具UI界面先拖入按钮&#xff0c;然后鼠标右键拖入按钮&#xff0c;点击选中槽&#xff0c;在页面选着需要的信号&#xff0c;然后OK&#xff0c;随即将会跳转到类的.cpp文件&#xff0c;&#xff08;这种UI代码结合的方式&#xff0c;会自动去绑定…

力扣101---对称二叉树(简单题)

题目描述&#xff1a; 给你一个二叉树的根节点 root &#xff0c; 检查它是否轴对称。 示例 1&#xff1a; 输入&#xff1a;root [1,2,2,3,4,4,3] 输出&#xff1a;true示例 2&#xff1a; 输入&#xff1a;root [1,2,2,null,3,null,3] 输出&#xff1a;false 非递归Java代…

Jenkins cron定时构建触发器

from&#xff1a; https://www.jenkins.io/doc/book/pipeline/syntax/#cron-syntax 以下内容为根据Jenkins官方文档cron表达式部分翻译过来&#xff0c;使用机翻加个人理解补充内容&#xff0c;包括举例。 目录 介绍举例&#xff1a;设置方法方法一&#xff1a;方法二&#xf…

通过简单的案例入门Mybatis~

目录 一.概述 二.JDBC的缺点 三.案例 1.创建测试类 2.加载Mybatis核心配置文件获取SqlSessionFactory 3.获取SqlSession对象 4.执行sql 5.释放资源 一.概述 Mybatis是一款持久层框架&#xff0c;用于简化JDBC开发。所谓框架&#xff0c;就是一个半成品软件&#xff0c;…

Redis管道和发布订阅

解决思路 类似mset打包批量处理 定义&#xff1a;Pipeline是为了解决RTT往返时延&#xff0c;仅仅将命令打包一次性发送&#xff0c;对Redis的执行不造成其他影响 需要把批量执行的命令都放到文件里面 命令解释 上一条命令的结果作为参数 通过Linux命令的管道 传输给管道后面…

Java代码基础算法练习---2024.3.14

其实这就是从我学校的资源&#xff0c;都比较基础的算法题&#xff0c;先尽量每天都做1-2题&#xff0c;练手感。毕竟离我真正去尝试入职好的公司&#xff08;我指的就是中大厂&#xff0c;但是任重道远啊&#xff09;&#xff0c;仍有一定的时间&#xff0c;至少要等我升本之后…

OCR文字识别训练数据整理的关键步骤和注意事项

在开发OCR文字识别产品时&#xff0c;为了确保准确性和可靠性&#xff0c;需要精心整理训练数据。特别是针对合同、证件、票据等文档类型&#xff0c;更需要有针对性地准备文字语料库。以下是针对OCR文字识别训练数据整理的一些建议&#xff1a; ### 整理训练数据的步骤&#…