【LLM】0x00 大模型简介

【LLM】0x00 大模型简介

news2025/4/27 11:39:27

0x00 大模型简介

个人问题
学习笔记
- 大模型简介
- - LLM 的能力：
  - LLM 的特点：
- LangChain 简介
- - LangChain 核心组件
- 小结
- 参考资料

个人问题

1、大模型是什么？
2、ChatGPT 在大模型里是什么？
3、大模型怎么用？

带着问题去学习，记录如下

学习笔记

大模型简介

大语言模型（Large Language Model, 缩写LLM）是旨在理解和生成人类语言的人工智能模型

LLM 被认为是 通用人工智能AGI 的早期形式，LLM 的杰出应用之一就是 ChatGPT

LLM 的能力：

涌现能力
- 上下文学习
  - 能够综合理解上下文从而更好的执行任务
- 指令遵循
  - 无需示例即可按照指令执行任务
- 逐步推理
  - LLM 拥有 ”思维链“ 推理策略
支持多元应用能力
- LLM 可以成为AI应用开发的基座模型（foundation model），基于其推理、常识和写作能力去建设其他多元应用
支持以对话为统一入口的能力
- 以 ChatGPT 为例，典型的通过对话交互进而完成各项工作

LLM 的特点：

巨大的规模
预训练和微调
上下文感知
多语言支持
多模态支持
- 在语言领域，”模态"通常指的是不同的表达方式或形式，比如文本、图像、语音等
涌现能力
- 模型性能随着参数规模增大而提升
多领域应用
伦理和风险问题

LangChain 简介

LangChain 框架（开源）可以为各种 LLM 应用提供通用接口，从而实现语言模型与其他数据来源连接，并且允许语言模型与其所处的环境进行互动，进而使 LLM 应用达到数据感知和环境互动的效果

LangChain 核心组件

模型输入/输出（Model I/O）：与语言模型交互的接口
数据连接（Data Connection）：与特定应用程序的数据进行交互的接口
链（Chains）：将组件组合实现端到端应用
记忆（Memory）：用于链的多次运行之间持久化应用程序状态
代理（Agents）：扩展模型的推理能力。用于复杂的应用的调用序列
回调（Callbacks）：扩展模型的推理能力。用于复杂的应用的调用序列

小结

1、简要了解了大模型的概念、特点及一些典型应用
2、简要了解 LangChain 框架的作用及核心组件的对应功能

两只陪我熬夜的挖煤小猫呜呜呜

听键盘声睡着的小猫哈哈哈

参考资料

动手学大模型 - 第一章大模型简介

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1209972.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

石原子科技亮相2023成都市信息领域新产品发布会

石原子科技亮相2023成都市信息领域新产品发布会

2023年11月13日至15日，由成都市互联网信息办公室、四川天府新区管委会、成都市经信局市新经济委、成都市农业农村局指导的以“信息创造价值创新引领未来”为主题的成都市信息领域新产品发布会在科创生态岛1号馆举行。围绕人工智能、区块链、数字化绿色化、数字乡村…

阅读更多...

c题目8：打印斐波那契数列前100项

c题目8：打印斐波那契数列前100项

每日小语终日寻春不见春，芒鞋踏破领投云。归来偶把梅花嗅，春在枝头已十分。——无尽藏解析题目 1.斐波那契数列是什么？ 斐波那契数列是一个数列，其中每个数字等于前两个数字的和。数列的前几个数字是0、1、1、2、3、5、8、…

阅读更多...

软件外包开发的开发文档

软件外包开发的开发文档

软件开发文档是一个重要的工具，用于记录和传达项目信息，帮助开发团队和利益相关者理解项目的各个方面。以下是一般性的软件开发文档编写格式，不同组织和项目可能有所不同，但这些通用准则可以帮助确保文档的清晰性和易读性&#xf…

阅读更多...

Docker - 网络

Docker - 网络

Docker - 网络理解Docker0 # 我们发现这个容器带来网卡，都是一对对的 # evth-pair 就是一对的虚拟设备接口，他们都是成对出现的，一段连着协议，一段彼此相连 # 正因为有了这个特性，evth-pair 充当一个桥梁&#xff0…

阅读更多...

八股文-面向对象的理解

八股文-面向对象的理解

近年来，IT行业的环境相较以往显得有些严峻，因此一直以来，我都怀有一个愿望，希望能够创建一个分享面试经验的网站。由于个人有些懒惰，也较为喜欢玩乐，导致计划迟迟未能实现。然而，随着年底的临近…

阅读更多...

466. 回文日期

466. 回文日期

题目： 466. 回文日期 - AcWing题库思路： 1.如果正向考虑，计算两天之间所以的回文数，应该如何枚举？没有明确的进制，那么只能列一个日历，这样会比较麻烦。 2.我们不妨采用逆向思维&#xff0…

阅读更多...

esp32cam串口问题

esp32cam串口问题

选择的串口 Failed to execute script esptool不存在或开发板没有连接设置串口参数时出错：9,600 N 8 1注意到他说的串口设置错误,但是在设置里不能设置串口参数所以说是串口打印的问题把他换成esp32用的115200就行

阅读更多...

一文了解VR全景拍摄设备如何选择，全景图片如何处理

一文了解VR全景拍摄设备如何选择，全景图片如何处理

引言： 在如今的数字化时代，虚拟现实（VR）技术不仅为我们的生活增添了许多乐趣，也为摄影领域带来了新的摄影方式，那么VR全景拍摄如何选择设备，全景图片又怎样处理呢？ 一. VR全景拍摄设…

阅读更多...

CRM系统对科技企业有哪些帮助

CRM系统对科技企业有哪些帮助

随着国家政策的倾斜和5G等相关基础技术的发展，中国人工智能产业在各方的共同推动下进入爆发式增长阶段，市场发展潜力巨大。CRM客户管理系统作为当下最热门的企业应用，同样市场前景广阔。那么，CRM系统对科技企业有哪些帮助&#xf…

阅读更多...

C++算法：全 O(1) 的数据结构

C++算法：全 O(1) 的数据结构

题目请你设计一个用于存储字符串计数的数据结构，并能够返回计数最小和最大的字符串。实现 AllOne 类： AllOne() 初始化数据结构的对象。 inc(String key) 字符串 key 的计数增加 1 。如果数据结构中尚不存在 key ，那么插入计数为 1 的 key…

阅读更多...

C++中关于多线程并发访问实例函数与静态函数

C++中关于多线程并发访问实例函数与静态函数

问题 1 C中多个线程共同执行一个实例函数，该函数是在线程的栈空间吗？对于函数中的多线程共享变量又是存储在哪里呢？ example: 在该例子中线程绑定当前对象(this)的实例函数captureVideo, 并将int参数传递过去。但是对于captureVideo中多个线…

阅读更多...

【Git】第五篇：基本操作（添加文件）

【Git】第五篇：基本操作（添加文件）

.git目录结构我们在前文中提过了.git目录，也明确说了我们不能手动去.git目录下创建修改等任何操作。添加文件我们现在已经了解到，git是一个版本控制器，可以对我们的文件进行管理。而我们需要使用git管理文件的时候，我们必须将…

阅读更多...

【工艺库】SMIC数字后端工艺库

【工艺库】SMIC数字后端工艺库

工艺库文件 Calibredigital文件夹apollolefprimetimesynopsys TD系列文件夹本来是想找一个工艺库，想要其包含逻辑综合和SPICE Model相关的库文件，但是找了很久也没有直接找到想要的，主要原因还是自己对工艺库文件的构成不是很清楚&#xff0…

阅读更多...

Sentinel浅层介绍（上）

Sentinel浅层介绍（上）

一、概述 Sentinel是阿里开源的一款面向分布式、多语言异构化服务架构的流量治理组件。主要以流量为切入点，从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热点流量防护等多个维度来帮助开发者保障微服务的稳定性。二、核心概念 1、资源资…

阅读更多...

【机器学习】决策树算法理论：算法原理、信息熵、信息增益、预剪枝、后剪枝、算法选择

【机器学习】决策树算法理论：算法原理、信息熵、信息增益、预剪枝、后剪枝、算法选择

1. 决策树概念通过不断的划分条件来进行分类，决策树最关键的是找出那些对结果影响最大的条件，放到前面。我举个列子来帮助大家理解，我现在给我女儿介绍了一个相亲对象，她根据下面这张决策树图来进行选择。比如年龄是女儿择偶更…

阅读更多...

【万字长文】Python 日志记录器logging 百科全书之日志过滤

【万字长文】Python 日志记录器logging 百科全书之日志过滤

Python 日志记录器logging 百科全书之日志过滤前言在Python的logging模块中，日志过滤器（Filter）用于提供更细粒度的日志控制。通过过滤器，我们可以决定哪些日志记录应该被输出，哪些应该被忽略。这对于复杂的应用…

阅读更多...

【开发工具】gitee还不用会？我直接拿捏＞_＞

【开发工具】gitee还不用会？我直接拿捏＞_＞

🌈键盘敲烂，年薪30万🌈 目录 git的一些前置操作如何获取本地仓库本地仓库的操作远程仓库操作合并两个仓库（通用方法） 从远程仓库拉取文件报错 fatal:refusing to merge unrelated histories 分支操作注意&…

阅读更多...

MHA实验和架构

MHA实验和架构

什么是MHA？ masterhight availabulity：基于主库的高可用环境下可以实现主从复制、故障切换 MHA的主从架构最少要一主两从 MHA的出现是为了解决MySQL的单点故障问题。一旦主库崩溃，MHA可以在0-30秒内自动完成故障切换。 MHA的数据流向和工…

阅读更多...

QT windows与linux之间sokcet通信中文乱码问题解决方法

QT windows与linux之间sokcet通信中文乱码问题解决方法

QT windows与linux之间sokcet通信中文乱码问题解决方法 linux发送与接收都转码utf-8: tcpClient ->write( send_msg.toUtf8());//解决乱码，发送转码接收： QByteArray buffer tcpClient->readAll(); if(!buffer.isEmpty()) { // ui->plain…

阅读更多...

[工业自动化-21]：西门子S7-15xxx编程 - 软件编程 - 如何快速看懂PLC梯形图？

[工业自动化-21]：西门子S7-15xxx编程 - 软件编程 - 如何快速看懂PLC梯形图？

目录预备：电气图 1. 电路图 2. 电气图一、梯形图概述 1.1 什么是梯形图 1.2 梯形图的作用二、梯形图中的主要元素三、梯形图的程序执行 3.1 梯形图扫描的原则 3.2 梯形图执行顺序 3.3 梯形图扫描预备：电气图 1. 电路图电路组成&#x…

阅读更多...

推荐文章

最新文章