人工智能 | 通俗讲解AI基础概念

news2025/1/8 5:37:06

LLM

LLM(Large Language Models)指的是大型语言模型。这些模型是自然语言处理(NLP)技术的一部分,使用深度学习训练来理解、生成、翻译文本,甚至执行特定的语言相关任务,如问答、文本摘要、编程代码生成等。LLM根据大量文本数据进行训练,以理解语言的结构、含义和上下文。

LLM的关键特征之一是其规模,即模型中包含的参数数量非常庞大。这些参数帮助模型捕获语言的复杂性和细微差别。随着模型规模的增加,它们的理解能力和生成文本的质量也会提高,但同时也会增加所需的计算资源和训练时间。

AGI

AGI(Artificial General Intelligence)也称为通用人工智能,指的是一种具有广泛智能的机器,能够理解、学习和应用知识,并能够在宽广范围的环境和任务中进行自主学习、推理、适应和创造,与人类智能相似或等同的水平。

区别于目前广泛应用的专业人工智能(AI)系统,这些系统通常优化和设计用来解决特定问题(如图像识别、语言翻译等),AGI能够跨领域工作,不仅局限于一个具体领域或任务。

AGI的实现将标志着一个重大科技进展,但同时也引发了许多伦理和安全的考量。目前AGI仍然是人工智能领域的一个长期目标,并且尚未实现。

AIGC

AIGC(Artificial Intelligence Generated Content)即为人工智能生成内容,是一种内容生产形式。例如AI文字续写,文字转像的AI图、AI主持人等,都属于AIGC的应用。

AI Agent

AI Agent 即智能代理,是一种基于人工智能技术的软件实体,它能够在一定的环境下自主感知信息、处理数据、并采取行动以实现特定目标。这种智能代理能够模拟人类的工作和思考方式,通过类似人类的独立思考和行动来完成一系列简单或复杂的任务。

大语言模型 (LLM) 仅限于它们所训练的知识,并且这些知识很快就会过时(每天用最新信息重新训练这么大的模型是不可行的),LLM的一些局限主要包括:

  • 会产生幻觉
  • 结果并不总是真实的
  • 对时事的了解有限或一无所知
  • 很难应对复杂的计算。

这就是AI Agent的用武之地,它可以利用外部工具来克服这些限制。可以将Agent视为人工智能大脑或LLM操作系统,它使用LLM进行推理、计划和采取行动。

智能体 Bot

是平台对AI Agent的抽象定义,即人工智能代理,是一个能够根据人类目标自主思考和规划任务的程序或实体。可以将智能体视为人工智能大脑或LLM操作系统,它使用LLM进行推理、计划和采取行动(调用工具)。

实际使用过程中,我们更建议为某个具体的应用场景创建专门的智能体,而不是什么工作都交给同一个智能体,只有让智能体做更专注的事情才能做的更加专业。

提示词 Prompt

简单的理解它是给 AI 模型的指令。它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。AI 模型会基于 prompt 所提供的信息,生成对应的文本或者图片。

针对智能体的提示词可能和对话的提示词略有不同,对话过程中的提示词上下文最多只有5条,智能体的编排提示词可以一直生效,而且通常具有一定的格式规范,更利于智能体执行任务。平台也预设了一些常用的智能体提示词可供用户选择。

RAG

RAG(Retrieval-Augmented Generation 检索增强生成)是一种结合了信息检索和文本生成技术的自然语言处理方法,它通过检索相关信息来辅助生成更准确和丰富的文本输出。

RAG的一个关键优势是它可以有效地处理那些不仅依赖于通用知识,而且还需要特定信息源或文档中的知识才能回答的问题。通过直接利用这些来源中的信息,RAG能够提供更加准确和信息含量更高的输出。

知识库 Knowledge Base

知识库指用于提供信息检索支持的大规模数据集合,包括用户上传到平台的各类文档、表格、数据表等资料,便于用户组织、管理领域知识,知识库可以理解为数据源。

知识库在RAG方案中的作用是多方面的:

  • 信息源:为生成模型提供丰富的背景信息和事实依据,使生成内容更加丰富和准确。
  • 提升效率:通过预先建立的知识库进行检索,可以减少生成模型需要从头计算或推理的信息量,提升处理速度和效率。
  • 增强准确性和相关性:基于检索到的与查询直接相关的信息,生成的内容更加贴近用户的实际需求,提升了回答的准确性和相关性。

因此,在RAG方案中,知识库的构建和质量直接影响到系统的整体性能,包括生成内容的准确度、丰富性和用户满意度。

多模态 Multi Modal

多模态指的是结合使用两种或两种以上不同类型的模式或信号来进行信息的表达、交流或处理。在计算机科学和人工智能领域,多模态通常涉及到结合文本、图像、音频、视频以及其他传感器数据来提升算法的理解、分析和生成能力。

多模态方法可以帮助系统更全面地理解复杂的信息场景,提高信息处理的效率和效果。

多路召回 Multi-channel Recall

多路召回是自然语言处理(NLP)和推荐系统中的一种常见策略,旨在从多个维度或渠道同时检索信息或物品,以提高召回质量和覆盖率。在这种策略中,系统会利用多个独立的算法或模型,每个算法或模型专注于从一个特定的角度或依据一个特定的特征来检索信息。

这些不同的召回渠道之后可以被合并或进一步处理,以生成一个综合的、多样化的结果集,从而提高最终推荐或检索结果的准确性和多样性。多路召回在提升用户体验和满足不同用户需求方面发挥着重要作用。

微调 Fine-Tuning

模型微调(Model Fine-tuning)是一种机器学习方法,特别是在深度学习领域中常见。这种方法涉及到在一个预训练的模型基础上,通过对模型进行额外的训练(或“微调”),使其更好地适应于特定任务或数据集。在模型微调过程中,通常会采用较小的学习率,对预训练模型的权重进行小幅度调整,以达到提高模型在特定任务上表现的目的。

模型微调的特点是能够利用预训练模型已经学到的知识,从而在数据量较少的情况下也能达到较好的性能,加速模型的训练过程并提高模型的泛化能力。

对齐Alignment

人工智能中的对齐是指引导人工智能系统的行为,使其符合设计者的利益和预期目标。一个已对齐的人工智能的行为会向着预期方向发展;而未对齐的人工智能的行为虽然也具备特定目标,但此目标并非设计者所预期。

Token

在自然语言处理中,我们通常将文本拆分为一个个离散的token,以便于计算机理解和处理在GPT模型中,token是模型接收的最小单位。模型在训练和生成文本时,将输入的文本序列划分为一系列的token,并通过对这些token进行处理和分析来生成响应。

例如:在一个对话中,一句话可以被划分为多个token,包括单词、标点符号等。每个token都有一个对应的编码表示,通常是一个整数。这些编码将文本转换为模型能够处理的数值形式。在使用ChatGPT时,用户通常需要了解自己的输入文本中有多少个token,以确保不超过模型的最大输入限制。

需要注意的是,不同的模型和工具可能对token的定义和处理方式有所不同但总体来说token是指文本处理和分析的最小单位,通常1Token的内容为5 字节的文本,但由于字符编码问题,不同中文字符的token数量并不是固定的,一般通过类OpenAI的接口调用会返回当前内容的token数量大小。

向量 Vector

向量,物理、工程等也称作矢量、欧几里得向量(Euclidean vector) 是数学、物理学和工程科学等多个自然科学中的基本概念。指一个同时具有大小和方向,且满足平行四边形法则的几何对象。理论数学中向量的定义为任何在称为向量空间的代数结构中的元素。

一般地,同时满足具有大小和方向两个性质的几何对象即可认为是向量。向量常常在以符号加箭头标示以区别于其它量。与向量相对的概念称标量、纯量、数量,即只有大小、绝大多数情况下没有方向(电流是特例)、不满足平行四边形法则的量。

向量数据库 Vector Database

向量数据库是基于智能算法提取需存储内容的特征,转变成具有大小定义、特征描述、空间位置的多维数值进行向量化存储的数据库,使内容不仅可被存储,同时可被智能检索与分析。

工具 Tool

是平台对智能体能力的抽象,通过工具的配置和组合可以实现多种业务场景需求,工具可以被实际关联到智能体的扩展能力,目前平台提供的工具包括大模型能力(文生图等)、联网查询(必应搜索)、知识库检索(知识管理检索)、函数调用(各种接口)等类型,将来还会拓展更多的工具类型。

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2035996.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Rancher的RKE和RKE2部署K8s集群kube-proxy开启strictARP

kube-proxy配置strictARPtrue 1、非RKE部署的K8s集群:配置首先,需要为kube-proxy启动strictARP,以便Kubernetes集群中的所有网卡停止响应其他网卡的ARP请求,而由OpenELB来处理ARP请求。 $ kubectl edit configmap kube-proxy -n…

关于k8s的pvc存储卷

目录 1.PVC 和 PV 1.1 PV 1.2 PVC 1.3 StorageClass 1.4 PV和PVC的生命周期 2.实战演练 2.1 创建静态pv 2.2 创建动态pv 3.总结 1.PVC 和 PV 1.1 PV PV 全称叫做 Persistent Volume,持久化存储卷。它是用来描述或者说用来定义一个存储卷的,…

Android SystemServer启动流程

文章目录 Android SystemServer启动流程概述流程图源码分析创建SystemServer进程启动SystemServer进程SystemServer#main()SystemServer#run()SystemServer#createSystemContext()SystemServer#startBootstrapServices()SystemServer#startCoreServices()SystemServer#startOth…

FFmpeg Filter过滤器实战

引文 - FFmpeg Filter的介绍 Filter,一般被译为"过滤器"或者"滤镜",本篇文章统一以"过滤器"著称。 那么过滤器的作用是什么呢?FFmpeg中的过滤器系统是在解码之后、编码之前对媒体流进行处理的关键组件。 下…

Java面试八股之什么是MQTT协议

什么是MQTT协议 MQTT(Message Queuing Telemetry Transport,消息队列遥测传输)是一种轻量级的“发布/订阅”(Publish/Subscribe)模式的消息传输协议,特别适合于远程和低带宽网络环境,如物联网&…

【向量数据库】向量数据库的构建和检索

1、使用 sentence-transformers 将文本编码为向量 安装 sentence-transformers: pip install -U sentence-transformers在 huggingface 下载 all-MiniLM-L6-v2 模型权重(1_Pooling 是文件夹,里面包含一个 config.json 文件)&…

Qt内存泄漏与程序异常崩溃

内存泄漏 什么是内存泄漏? 内存泄漏(Memory Leak)指的是程序在动态分配内存后未能正确释放已分配的内存,导致这些内存块无法被再次使用或回收。内存泄漏的发生主要是在使用堆内存(通过new或malloc分配的内存&#xf…

ZBrush入门使用介绍——8、模型网格显示隐藏和遮罩操作

大家好,我是阿赵。   有时候我们需要把需要雕刻的范围限制在某个局部,之前也介绍过一些方法,比如使用遮罩。这里再详细说一下具体的操作。这次我拿这个圆柱为例子,先生成多边形网格,再CtrlD几次增加一点细分级别。 …

【css】使用!important提升选择器的优先级

背景 昨天我的个人博客备案通过了嘛,然后我就想着完善页面底部的备案信息,参考Argon主题博客美化的 网站底部信息 但是我想要把icp备案和公安联网备案的信息分开,即 subject-value-value 的结构, 因为 value 的选择器里面写的是…

ThinkPHP教程

thinkPHP笔记 01. phpEnv配置安装 主讲老师 - 李炎恢 1. 学习基础 ThinkPHP8.x: 前端基础:HTML5/CSS(必须)、JavaScript(可选、但推荐有);后端基础:PHP基础,版本不限,但不能太老,至少PHP5.4以上语法,TP8是兼容PHP8.x的;数据库基础:MySQL数据库,掌握了常规的SQL…

uni-app总结

1. <u-form-item label"报废人" ><u--input v-model"model.remark" border"bottom" placeholder"请输入"></u--input> </u-form-item> border"bottom" 报废日期 为了

【海贼王航海日志:前端技术探索】一篇文章带你走进JavaScript(一)

目录 1 -> 初识JavaScript 1.1 -> JavaScript是什么 1.2 -> 发展历史 1.3 -> JavaScript和HTML和CSS之间的关系 1.4 -> JavaScript运行过程 1.5 -> JavaScript的组成 2 -> 前置知识 2.1 -> JavaScript的书写形式 2.2 -> 注释 2.3 -> 输…

Stable Diffusion-inpaint(mask补全)是怎么做的?

AIGC专栏4——Stable Diffusion原理解析-inpaint修复图片为例_diffusion inpaint-CSDN博客 如果我们必须训练一个inpaint模型才能对当前的模型进行inpaint&#xff0c;那就太麻烦了&#xff0c;有没有什么方法可以不需要训练就能inpaint呢&#xff1f; Stable Diffusion就是一…

Unity新输入系统 之 InputAction(输入配置文件最基本的单位)

本文仅作笔记学习和分享&#xff0c;不用做任何商业用途 本文包括但不限于unity官方手册&#xff0c;unity唐老狮等教程知识&#xff0c;如有不足还请斧正​ 首先你应该了解新输入系统的构成结构&#xff1a;Unity新输入系统结构概览-CSDN博客 Input System - Unity 手册 1.In…

创客匠人媛姐:做得一切都是为了拿到结果!

大家好&#xff0c;我是媛姐。近期我做了《百场IP发售销讲实战宣讲-发售教练点评》的直播活动。邀请了艺得世界人才创造社白钰玮老师为大家现场演练一场销讲&#xff0c;展示发售销讲私教班的培训成果。结果证明&#xff0c;白老师完成得非常出色。 以下&#xff0c;我将分享一…

WPF APP生命周期和全局异常捕获

应用启动事件与启动参数 属性查找 选择想要控件的事件&#xff0c;可以在控件上鼠标右击选择属性&#xff0c;在右上角点击闪电符号即可看到这个控件的所有事件&#xff1a; APP.Run()启动方法&#xff1a; 打开项目中这个文件&#xff1a; ".....\XH.EventLesson\obj…

Chapter 9 Operational Amplifiers

Chapter 9 Operational Amplifiers operational amplifier (op-amp) 运算放大器无疑是模拟电路中最基础最重要的block之一. 这一章我们首先review telescopic and folded-cascode 拓扑, 然后学习two-stage and gain-boosting 结构, 和共模反馈问题, 最后引入slew rate, 分析su…

基于Python、Django开发Web计算器

1、创建项目 创建Django项目参照https://blog.csdn.net/qq_42148307/article/details/140798249&#xff0c;其中项目名为compute&#xff0c;并在该项目下创建一个名为app的应用&#xff0c;并且进行基本的配置。 2、导入Bootstrap前端框架 Bootstrap的使用参照https://blo…

【项目分享】使用python的ttkbootstrap模块构建一个炫酷的计时器

目录 前言 项目背景 项目展示(图片) 项目实现 1. 安装与设置 2. 创建主窗口 3. 初始化计时器功能 4. 实现计时功能 5. 实现隐藏边框与置顶功能 6. 运行应用 完整代码 结论 🌟 嗨,我是命运之光! 🌍 2024,每日百字,记录时光,感谢有你一路同行。 🚀 携…

TCP详解(二)滑动窗口/流量控制

本文解释了TCP为何能保证数据传输的可靠性&#xff0c;以及如何保证整个网络的顺畅。 1 网络分层模型 这是一切的本质。网络被设计成分层的&#xff0c;所以网络的操作就可以称作一个“栈”&#xff0c;这就是网络协议栈的名称的由来。在具体的操作上&#xff0c;数据包最终形…