【LLM】0x00 大模型简介

news2024/11/21 0:19:48

0x00 大模型简介

  • 个人问题
  • 学习笔记
    • 大模型简介
      • LLM 的能力:
      • LLM 的特点:
    • LangChain 简介
      • LangChain 核心组件
    • 小结
    • 参考资料

个人问题

1、大模型是什么?
2、ChatGPT 在大模型里是什么?
3、大模型怎么用?

带着问题去学习,记录如下

学习笔记

大模型简介

大语言模型(Large Language Model, 缩写LLM)是旨在理解和生成人类语言的人工智能模型

LLM 被认为是 通用人工智能AGI 的早期形式,LLM 的杰出应用之一就是 ChatGPT

LLM 的能力:

  • 涌现能力
    • 上下文学习
      • 能够综合理解上下文从而更好的执行任务
    • 指令遵循
      • 无需示例即可按照指令执行任务
    • 逐步推理
      • LLM 拥有 ”思维链“ 推理策略
  • 支持多元应用能力
    • LLM 可以成为AI应用开发的基座模型(foundation model),基于其推理、常识和写作能力去建设其他多元应用
  • 支持以对话为统一入口的能力
    • 以 ChatGPT 为例,典型的通过对话交互进而完成各项工作

LLM 的特点:

  • 巨大的规模
  • 预训练和微调
  • 上下文感知
  • 多语言支持
  • 多模态支持
    • 在语言领域,”模态"通常指的是不同的表达方式或形式,比如文本、图像、语音等
  • 涌现能力
    • 模型性能随着参数规模增大而提升
  • 多领域应用
  • 伦理和风险问题

LangChain 简介

LangChain 框架(开源)可以为各种 LLM 应用提供通用接口,从而实现语言模型与其他数据来源连接,并且允许语言模型与其所处的环境进行互动,进而使 LLM 应用达到数据感知和环境互动的效果

LangChain 核心组件

  • 模型输入/输出(Model I/O):与语言模型交互的接口
  • 数据连接(Data Connection):与特定应用程序的数据进行交互的接口
  • 链(Chains):将组件组合实现端到端应用
  • 记忆(Memory):用于链的多次运行之间持久化应用程序状态
  • 代理(Agents):扩展模型的推理能力。用于复杂的应用的调用序列
  • 回调(Callbacks):扩展模型的推理能力。用于复杂的应用的调用序列

小结

1、简要了解了大模型的概念、特点及一些典型应用
2、简要了解 LangChain 框架的作用及核心组件的对应功能

两只陪我熬夜的挖煤小猫呜呜呜
两只陪我熬夜的挖煤小猫呜呜呜
听键盘声睡着的小猫哈哈哈
听键盘声睡着的小猫哈哈哈

参考资料

动手学大模型 - 第一章 大模型简介

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1209972.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

石原子科技亮相2023成都市信息领域新产品发布会

2023年11月13日至15日,由成都市互联网信息办公室、四川天府新区管委会、成都市经信局市新经济委、成都市农业农村局指导的以“信息创造价值 创新引领未来”为主题的成都市信息领域新产品发布会在科创生态岛1号馆举行。围绕人工智能、区块链、数字化绿色化、数字乡村…

c题目8:打印斐波那契数列前100项

每日小语 终日寻春不见春,芒鞋踏破领投云。 归来偶把梅花嗅,春在枝头已十分。——无尽藏 解析题目 1.斐波那契数列是什么? 斐波那契数列是一个数列,其中每个数字等于前两个数字的和。数列的前几个数字是0、1、1、2、3、5、8、…

软件外包开发的开发文档

软件开发文档是一个重要的工具,用于记录和传达项目信息,帮助开发团队和利益相关者理解项目的各个方面。以下是一般性的软件开发文档编写格式,不同组织和项目可能有所不同,但这些通用准则可以帮助确保文档的清晰性和易读性&#xf…

Docker - 网络

Docker - 网络 理解Docker0 # 我们发现这个容器带来网卡,都是一对对的 # evth-pair 就是一对的虚拟设备接口,他们都是成对出现的,一段连着协议,一段彼此相连 # 正因为有了这个特性,evth-pair 充当一个桥梁&#xff0…

八股文-面向对象的理解

近年来,IT行业的环境相较以往显得有些严峻,因此一直以来,我都怀有一个愿望,希望能够创建一个分享面试经验的网站。由于个人有些懒惰,也较为喜欢玩乐,导致计划迟迟未能实现。然而,随着年底的临近…

466. 回文日期

题目: 466. 回文日期 - AcWing题库 思路: 1.如果正向考虑,计算两天之间所以的回文数,应该如何枚举?没有明确的进制,那么只能列一个日历,这样会比较麻烦。 2.我们不妨采用逆向思维&#xff0…

esp32cam串口问题

选择的串口 Failed to execute script esptool不存在或开发板没有连接 设置串口参数时出错:9,600 N 8 1注意到他说的串口设置错误,但是在设置里不能设置串口参数 所以说是串口打印的问题 把他换成esp32用的115200就行

一文了解VR全景拍摄设备如何选择,全景图片如何处理

引言: 在如今的数字化时代,虚拟现实(VR)技术不仅为我们的生活增添了许多乐趣,也为摄影领域带来了新的摄影方式,那么VR全景拍摄如何选择设备,全景图片又怎样处理呢? 一. VR全景拍摄设…

CRM系统对科技企业有哪些帮助

随着国家政策的倾斜和5G等相关基础技术的发展,中国人工智能产业在各方的共同推动下进入爆发式增长阶段,市场发展潜力巨大。CRM客户管理系统作为当下最热门的企业应用,同样市场前景广阔。那么,CRM系统对科技企业有哪些帮助&#xf…

C++算法:全 O(1) 的数据结构

题目 请你设计一个用于存储字符串计数的数据结构,并能够返回计数最小和最大的字符串。 实现 AllOne 类: AllOne() 初始化数据结构的对象。 inc(String key) 字符串 key 的计数增加 1 。如果数据结构中尚不存在 key ,那么插入计数为 1 的 key…

C++中关于多线程并发访问实例函数与静态函数

问题 1 C中多个线程共同执行一个实例函数,该函数是在线程的栈空间吗?对于函数中的多线程共享变量又是存储在哪里呢? example: 在该例子中线程绑定当前对象(this)的实例函数captureVideo, 并将int参数传递过去。但是对于captureVideo中多个线…

【Git】第五篇:基本操作(添加文件)

.git目录结构 我们在前文中提过了.git目录,也明确说了我们不能手动去.git目录下创建修改等任何操作。 添加文件 我们现在已经了解到,git是一个版本控制器,可以对我们的文件进行管理。而我们需要使用git管理文件的时候,我们必须将…

【工艺库】SMIC数字后端工艺库

工艺库文件 Calibredigital文件夹apollolefprimetimesynopsys TD系列文件夹 本来是想找一个工艺库,想要其包含逻辑综合和SPICE Model相关的库文件,但是找了很久也没有直接找到想要的,主要原因还是自己对工艺库文件的构成不是很清楚&#xff0…

Sentinel浅层介绍(上)

一、概述 Sentinel是阿里开源的一款面向分布式、多语言异构化服务架构的流量治理组件。 主要以流量为切入点,从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热点流量防护等多个维度来帮助开发者保障微服务的稳定性。 二、核心概念 1、资源 资…

【机器学习】决策树算法理论:算法原理、信息熵、信息增益、预剪枝、后剪枝、算法选择

1. 决策树概念 通过不断的划分条件来进行分类,决策树最关键的是找出那些对结果影响最大的条件,放到前面。 我举个列子来帮助大家理解,我现在给我女儿介绍了一个相亲对象,她根据下面这张决策树图来进行选择。比如年龄是女儿择偶更…

【万字长文】Python 日志记录器logging 百科全书 之 日志过滤

Python 日志记录器logging 百科全书 之 日志过滤 前言 在Python的logging模块中,日志过滤器(Filter)用于提供更细粒度的日志控制。通过过滤器,我们可以决定哪些日志记录应该被输出,哪些应该被忽略。这对于复杂的应用…

【开发工具】gitee还不用会?我直接拿捏 >_>

🌈键盘敲烂,年薪30万🌈 目录 git的一些前置操作 如何获取本地仓库 本地仓库的操作 远程仓库操作 合并两个仓库(通用方法) 从远程仓库拉取文件报错 fatal:refusing to merge unrelated histories 分支操作 注意&…

MHA实验和架构

什么是MHA? masterhight availabulity:基于主库的高可用环境下可以实现主从复制、故障切换 MHA的主从架构最少要一主两从 MHA的出现是为了解决MySQL的单点故障问题。一旦主库崩溃,MHA可以在0-30秒内自动完成故障切换。 MHA的数据流向和工…

QT windows与linux之间sokcet通信中文乱码问题解决方法

QT windows与linux之间sokcet通信中文乱码问题解决方法 linux发送与接收都转码utf-8: tcpClient ->write( send_msg.toUtf8());//解决乱码,发送转码 接收: QByteArray buffer tcpClient->readAll(); if(!buffer.isEmpty()) { // ui->plain…

[工业自动化-21]:西门子S7-15xxx编程 - 软件编程 - 如何快速看懂PLC梯形图?

目录 预备:电气图 1. 电路图 2. 电气图 一、梯形图概述 1.1 什么是梯形图 1.2 梯形图的作用 二、梯形图中的主要元素 三、梯形图的程序执行 3.1 梯形图扫描的原则 3.2 梯形图执行顺序 3.3 梯形图扫描 预备:电气图 1. 电路图 电路组成&#x…