一本了解生成式人工智能

news2024/10/6 20:31:21

上周,发了一篇关于大语言模型+图数据库技术相结合的文章,引起了很多朋友的兴趣。当然了,这项技术本身就让俺们很兴奋,比如我就是从事图研发的,当然会非常关注它在图领域的应用与相互促就啦。

纵观人类文明历史,从第一次工业革命之后,技术成为了改变世界进程的引擎,生产力和生产关系进入了一个全新的时期。如从美索不达比亚第一株被驯服的小麦,人类从原始狩猎采集转为种植和定居,蒸汽机改变了人类对能源的依赖模式,人类从此步入城市化和工业化。时至今日,我们又在经历一个新的创新周期——人工智能驱动的数字化时代(虽然很多人都在担心智能伦理方面的问题,但并没有影响各界对该技术的热情和关注。)

本文围绕以下几点聊聊,当是对前一篇文章《LLM+Graph:大语言模型与图数据库技术的协同》的一个前传吧。

· 啥是生成式人工智能

· 生成式人工智能的历史

· 法学硕士又是神马东西?

· 生成式人工智能都有啥类型和关键特征?

· 有什么局限性? 和图数据库技术的结合

一、啥是生成式人工智能

生成式人工智能是一种先进技术,能够生成文本、语音、视觉甚至合成数据形式的内容。

它利用深度学习模型和大型语言模型来完成创建新颖内容的任务。

它绝对不仅仅是进行上下文对话,还包括定制建议、直观的解决方案等等。其应用广泛分布在从高科技到农业和消费品的各个行业。

Gartner将生成式 AI 置于 2023 年新兴技术成熟度曲线期望最高的位置

德勤估计,到 2032 年,生成式人工智能的市场规模将达到 200B 美元。这占人工智能总支出的约 20%,高于目前的约 5%

二、生成式人工智能的历史

其历史至少可以追溯到 70 年前,当时人类真正开始怀疑机器是否有能力像人类一样思考和处理。

20 世纪 50 年代:文本分析 — 人工智能的黎明

20世纪50年代至60年代初,人工智能(AI)领域仍处于起步阶段。研究人员正在探索创造能够模拟人类智能的机器的可能性。这个方向最早的努力之一是文本分析。这个时代见证了用于处理和分析文本数据的基本计算机程序的发展。早期的文本分析系统主要专注于信息检索和关键字提取等简单任务。这个想法是让计算机能够以类似于人类理解的方式理解和操作文本。虽然这些努力在当时具有开创性,但它们的能力有限,并且缺乏我们今天与人工智能相关的复杂程度。

20 世纪 60 年代:基于规则的系统和知识库

在 20 世纪 60 年代后半叶和整个 70 年代,人工智能研究转向基于规则的系统和知识库。研究人员试图使用明确的规则和逻辑推理将人类知识和专业知识编码到计算机程序中。这种方法导致了专家系统的发展,该系统能够通过遵循预定义的规则来解决特定问题。专家系统标志着人工智能向前迈出了重要一步,因为它们证明计算机可以执行需要人类专业知识的任务。然而,它们受到大量手动规则编写的需要和对新领域的有限适应性的限制。

20 世纪 80 年代:自然语言处理出现

20 世纪 80 年代和 90 年代见证了自然语言处理 (NLP) 的出现,这是人工智能中的一个关键领域,旨在使机器能够理解和生成人类语言。研究人员开始开发更先进的技术来解析和分析文本,为机器翻译、语音识别和情感分析等应用铺平道路。NLP 系统在很大程度上仍然是基于规则的,依赖于语法和句法规则。这些系统能够处理比早期文本分析更复杂的语言任务,但它们距离实现人类水平的语言理解还很远。

2000 年代:机器学习和大数据革命

世纪之交标志着随着机器学习的兴起和大量数字数据的出现,人工智能研究发生了重大转变。事实证明,机器学习算法,特别是神经网络,在解决各种人工智能任务(包括与文本和语言相关的任务)方面非常有效。这个时代催生了“大数据”的概念和大规模数据分析的发展。随着深度学习等技术的出现和海量数据集的出现,人工智能模型越来越能够理解和生成人类语言。

2020 年代:GPT-3 和生成式 AI 的突破

2020年代,世界见证了GPT-3(生成式预训练变压器3),这是一种革命性的人工智能模型,标志着人工智能和自然语言处理领域的一个重要里程碑。GPT-3 在大量文本数据上进行了预训练,可以生成高度连贯且上下文相关的文本。

GPT 的发展仍在继续,推出了运行 ChatGPT 的 GPT 3.5 和最新版本的 GPT 4。

三、法学硕士又是神马东西?

如果不了解大型语言模型,那么关于生成式人工智能的讨论就是不完整的,人们简称为法学硕士。大型语言模型是在具有大量参数的大型未标记数据集上进行训练的。GPT-3 经过超过 1750 亿个参数的训练!

值得一提的是,LLM(语言模型)和生成式人工智能是相关的概念,但它们在侧重点、能力和应用方面存在明显差异。

一些众所周知的法学硕士是:

Open AI 的 GPT 3、3.5 和 4

谷歌的 LaMDA 和 PaLM

Meta 的 LLaMA

NVidia 的 NeMO 法学硕士

在这个列表中,Meta 的 LLaMA 是一个开源 LLM,世界各地的开发人员都可以利用它来创建可定制的私有模型。

四、生成式人工智能都有啥类型和关键特征?

生成式 AI 模型是人工智能 (AI) 模型的一个子集,旨在生成与现有数据相似或遵循现有数据中的模式的新数据。生成式 AI 模型不同于其他专注于分类、预测或强化学习的 AI 模型。

以下是生成式人工智能模型的一些关键特征和类型:

数据生成:生成式人工智能模型能够创建模仿训练数据中观察到的模式或风格的新内容。该内容可以采用多种形式,包括文本、图像、音乐等。

无监督学习:许多生成模型采用无监督学习技术,模型在没有明确标签或目标的情况下学习数据中的模式和结构。这使它们能够生成数据,而不需要应生成的具体示例。

可变性:生成模型通常以其产生不同输出的能力为特征。如它们可以生成不同风格的艺术,以不同方式重新表述相同的文本段落,或者图像的多个版本。

一些常见类型的生成人工智能模型:

生成对抗网络(GAN):GAN 由两个处于竞争关系的神经网络(生成器和判别器)组成。生成器创建数据,而鉴别器评估该数据的真实性。这种对抗性过程导致生成器提高了创建真实数据的能力。GAN 已广泛用于图像生成、风格迁移和内容创建。

变分自动编码器 (VAE):VAE 是基于概率建模原理的生成模型。他们的目标是了解数据的潜在概率分布。VAE 通常用于图像生成、数据压缩和图像重建。

循环神经网络 (RNN):RNN 是一种专门为序列数据(例如文本和时间序列数据)设计的神经网络架构。它们用于文本生成、机器翻译和语音识别。然而,传统的 RNN 在捕获长期依赖性方面存在局限性。

长短期记忆 (LSTM) 网络:LSTM 是一种特殊类型的 RNN,可以捕获顺序数据中的长程依赖性。事实证明,它们在自然语言处理任务中非常有效,包括语言建模、文本生成和情感分析。

生成式预训练 Transformer (GPT):GPT 模型是生成人工智能领域的最新突破。这些模型利用 Transformer 架构和对文本数据的大规模预训练来生成连贯且上下文相关的文本。他们擅长各种自然语言理解和生成任务,包括聊天机器人、内容生成、翻译等。

五、有什么局限性? 和图数据库技术怎么结合?

以下是大模型局限性的几个表现列举:

模型的知识受限于它所训练的数据。见下图:

黑盒化,不可解释性:大模型作为黑盒模型,它们以参数的形式隐式地表示知识。由于大模型生成的结果中没有包含任何来源或参考,我们很难解释或验证其可信度。这严重影响了大模型的应用,尤其是在医疗诊断、金融咨询和法律判断等高风险的场景中。另一个挑战在于,大模型是为了一般用途而训练的,企业专有、保密或敏感的未公开数据并不在它们的知识范围内。

……

下面的配图直观的展示了现有大模型的局限性,以及图数据库如何增强大模型。

大模型无法实现(或替代)图数据库的深层检索

图数据库的海量结构化(深度、精准、白盒化)查询可以直接增强 LLM大模型能力

与Graph相协同后,这个关联成吉思汗和牛顿的4跳因果关系横跨东西方,跨越了400年的历史。通过图的深度穿透和因果关系搜索,生动地呈现在我们眼前了,见下图:

时至今日,很多研究人员已经认识到大模型和图技术之间固有的互补性。通过结合大模型的文本理解能力和图的结构化推理能力,能够整体增强AI系统的功能性、智能性和可解释性。 更多大模型与“图”的实践应用,本文不多赘述,感兴趣的盆友,可以阅读文章——嬴图 | LLM+Graph:大语言模型与图数据库技术的协同 - Ultipa Graph

文/Emma

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1211790.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uniapp——项目day05

购物车页面 结算区域 把结算区域封装为组件 1. 在 components 目录中&#xff0c;新建 my-settle 结算组件&#xff1a; 2. 初始化 my-settle 组件的基本结构和样式&#xff1a; <template><view class"my-settle-container">结算组件</view> …

代码随想录算法训练营第21天|530.二叉搜索树的最小绝对差 501.二叉搜索树中的众数 236. 二叉树的最近公共祖先

JAVA代码编写 530.二叉搜索树的最小绝对差 给你一个二叉搜索树的根节点 root &#xff0c;返回 树中任意两不同节点值之间的最小差值 。 差值是一个正数&#xff0c;其数值等于两值之差的绝对值。 示例 1&#xff1a; 输入&#xff1a;root [4,2,6,1,3] 输出&#xff1a;1…

内网穿透工具NPS(保姆级教程)

前言&#xff1a; 有时候我们受限于硬件设备和网络的的问题&#xff0c;无法将内网的大容量、高性能存储设备或计算设备对外访问。这个时候就会变的特别苦恼&#xff0c;上云呢成本太大&#xff0c;不用云呢公网又无法直接访问&#xff0c;这个时候怎么办呢&#xff0c;NPS它来…

华为云优惠券介绍、领取入口及使用教程

华为云是华为的云服务品牌&#xff0c;致力于为用户提供一站式云计算基础设施服务。为了吸引用户&#xff0c;华为云经常推出各种优惠活动&#xff0c;其中就包括优惠券的发放&#xff0c;下面将为大家详细介绍华为云优惠券的作用、领取入口以及使用教程。 一、华为云优惠券介绍…

SDL2 播放视频文件(MP4)

1.简介 这里引入FFmpeg库&#xff0c;获取视频流数据&#xff0c;然后通过FFmpeg将视频流解码成YUV原始数据&#xff0c;再将YUV数据送入到SDL库中实现视频播放。 2.FFmpeg的操作流程 注册API&#xff1a;av_register_all()构建输入AVFormatContext上下文&#xff1a;avform…

如何检查 Docker 和 Kubernetes 是否可以访问外部网络,特别是用于拉取镜像的仓库?

要检查 Docker 和 Kubernetes 是否可以访问外部网络&#xff0c;尤其是用于拉取容器镜像的仓库&#xff0c;您可以按照以下步骤进行&#xff1a; 1. 检查节点的网络连接 首先&#xff0c;您需要确保 Kubernetes 节点能够访问外部网络。这可以通过在节点上执行 ping 命令来测试…

11月第2周榜单丨飞瓜数据B站UP主排行榜榜单(B站平台)发布!

飞瓜轻数发布2023年11月6日-11月12日飞瓜数据UP主排行榜&#xff08;B站平台&#xff09;&#xff0c;通过充电数、涨粉数、成长指数、带货数据等维度来体现UP主账号成长的情况&#xff0c;为用户提供B站号综合价值的数据参考&#xff0c;根据UP主成长情况用户能够快速找到运营…

Linux安装jdk1.8教程(服务器可以访问网络)

文章目录 前言创建安装目录查看是否安装过下载解压配置环境变量查看是否安装成功 前言 本教程介绍了一种快捷的jdk1.8安装方法。 创建安装目录 mkdir -p /opt/software // 这是我自己的安装目录&#xff0c;根据自己的习惯确定查看是否安装过 rpm -qa | grep -i jdk需要注意…

2023年人工智能还好找工作吗?

人工智能的就业形势并不严峻&#xff0c;相反&#xff0c;很多岗位都是供不应求的状态&#xff0c;可以看一下下面的官方数据。 脉脉高聘人才智库发布《2023泛人工智能人才洞察》&#xff0c;对23年1-8月的人工智能行业现状进行了分析总结。 人工智能相关岗位数据&#xff1a…

探索游戏公司跨部门合作的项目管理工具选择

为了实现出色的用户体验&#xff0c;游戏公司需要强大的研发能力和发行运营经验。通常情况下&#xff0c;游戏公司内部有多个独立工作的研发部门和发行部门&#xff0c;它们需要跨部门协作。随着公司快速发展和游戏项目增加&#xff0c;游戏公司迫切需要一套适用于特殊协作流程…

vue中ref的用法

vue中ref的用法 在项目中使用ref时有时候直接取值,有时候返回的却是一个数组,不知其中缘由,后查了一下ref用法,所以总结一下. 1.绑定在dom元素上时&#xff0c;用起来与id差不多&#xff0c;通过this.$refs来调用: <div id"passCarEchart" ref"passCarEch…

浙江大学数据结构陈越 第一讲 数据结构和算法

数据结构 数据结构是计算机科学中用来组织和存储数据的方式。它可以理解为一种组织数据的方式&#xff0c;能够有效地管理和操作数据&#xff0c;以及提供对数据进行存储、检索、更新和删除等操作的方法。常见的数据结构包括数组、链表、栈、队列、树和图等&#xff0c;它们各自…

竞赛选题 深度学习的视频多目标跟踪实现

文章目录 1 前言2 先上成果3 多目标跟踪的两种方法3.1 方法13.2 方法2 4 Tracking By Detecting的跟踪过程4.1 存在的问题4.2 基于轨迹预测的跟踪方式 5 训练代码6 最后 1 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 基于深度学习的视频多目标跟踪实现 …

vue项目使用electron打包exe桌面程序

首先在vue项目中cmd进入终端&#xff0c;然后第一次下载electron依赖需要切换镜像&#xff0c;否则下载得很慢很慢&#xff0c;在终端中输入以下两个命令 将 Electron Builder Binaries 的镜像源设置为淘宝的 npm 镜像源。这同样用于提升 Electron Builder 相关包的下载速度。 …

Android 摇一摇功能实现,重力加速度大于15

最近接到需求实现摇一摇需求&#xff0c;不过这个法律限制的很严格&#xff0c;属于敏感地带&#xff0c;实现后又被叫停了。 法律要求&#xff1a; 如果按照规定&#xff0c;操作时间不少于3s就基本没什么跳转了。 实现的话&#xff0c;只考虑了第一条&#xff0c;即&#…

你绝对需要的Facebook养号攻略,教你如何养成耐用号

Facebook 可谓是大家的“老熟人”了&#xff0c;作为全球热门的社交媒体平台&#xff0c;Facebook 一直以来都是社媒营销、跨境电商的重要阵地&#xff0c;但是很多小伙伴们在注册新账号后往往忽略了一个重要的步骤&#xff0c;也是必不可少的一步&#xff0c;那就是养号&#…

Java 轻松删除PDF指定页、空白页 (免费工具分享)

对PDF页面的增删通常需要借助专门的工具&#xff0c;而这些工具一般需要付费才能使用。那么我们可以通过Java代码免费实现这一功能吗&#xff1f;答案是肯定的。这篇文章就教大家如何使用一个免费的国产Java库来删除PDF中的指定页面或者删除PDF中的空白页。 使用Java快速删除PD…

git push 报错 The requested URL returned error: 500

今天gitpush时报错The requested URL returned error: 500 看报错应该是本地和gitlab服务器之间通信的问题&#xff0c;登录gitlab网站查看 登录时报错无法通过ldapadmin认证&#xff0c;ldap服务器连接失败。 首先&#xff0c;登录ldap服务器&#xff0c;查看是否是ldap服务…

【星海出品】SDN neutron (五) openvswitch

1、ovs-vswitchd组件是交换机的主要模块&#xff0c;运行在用户态&#xff0c;其主要负责基本的转发逻辑、地址学习、外部物理端口绑定等。还可以运用OVS自带的ovs-ofctl工具采用openflow协议对交换机进行远程配置和管理。 2、ovsdb-server组件是存储OVS的网桥等配置、日志以及…

(论文阅读34-39)理解CNN

34.文献阅读笔记 简介 题目 Understanding image representations by measuring their equivariance and equivalence 作者 Karel Lenc, Andrea Vedaldi, CVPR, 2015. 原文链接 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Lenc_Understanding_I…