不是ChatGPT模型,第一个GAI是ELIZA,你听说过吗?

news2024/12/29 10:52:09

人工智能(Artificial Intelligence, AI)的概念可以追溯到20世纪50年代,当时数学家和计算机科学家开始探讨如何让机器模拟人类智能。1956年,达特茅斯会议被认为是人工智能研究的正式起点。然而,生成式人工智能(Generative Artificial Intelligence, GAI)的发展历程当从20世纪60年代的诞生开始,到了今天,生成模型不仅限于文本生成,还扩展到图像生成、音乐生成和视频生成等领域。

(1960年代)的ELIZA的出现

生成式人工智能的旅程始于约瑟夫·韦森鲍姆(Joseph Weizenbaum)在1966年开发的ELIZA开发。ELIZA的重要性不仅在于其技术成就;它是第一个以智能对话形式出现的程序之一,是现代聊天机器人(chatbot)的先驱,也是早期尝试解决图灵测试的著名案例。

ELIZA,这个名字取自乔治·萧伯纳的戏剧《皮格马利翁》中的纯真少女。ELIZA可以与用户进行聊天,使用韦森鲍姆自己创建的SLIP编程语言编写。该程序应用模式匹配规则来生成回复(这类程序现在被称为聊天机器人)。ELIZA由一个名为DOCTOR的脚本驱动,能够与人类进行对话,其对话风格令人惊讶地类似于富有同理心的心理学家。韦森鲍姆还模仿了心理治疗师卡尔·罗杰斯(Carl Rogers)的对话风格,后者引入了开放性问题,以鼓励患者更有效地与治疗师交流。

其实,刚开始的时候,韦森鲍姆开发ELIZA的初衷是探索人机交流的动态。但是,他发现尽管ELIZA并不真正理解用户与机器之间的对话,但它通过模式匹配和替换技术创造了理解的假象。然而用户对ELIZA的情感反应感到惊讶,许多人将人类般的特质归因于该程序。这种现象后来被称为“ELIZA效应”。

“ELIZA 效应”指的是人们在与看似智能的计算机程序交流时,倾向于赋予其超出实际能力的理解和智能感知。例如,当用户向 ELIZA 倾诉自己的烦恼时,即使回复只是一些模式化的语句,用户也可能会觉得得到了有意义的回应和理解。这种效应揭示了人们在与技术交互时,容易产生对技术智能程度的过高估计。

这促使韦森鲍姆深刻反思人工智能的影响及其误导人们对机器能力的潜在风险。韦森鲍姆的后续著作,特别是他的书《计算机的力量与人类的理性》(Computer Power and Human Reason),阐述了他对人工智能伦理问题的担忧,强调了人类判断与机器计算之间的区别。

(1980年代–2000年代)深度学习的年代

1980年代至2000年代是深度学习的早期阶段,主要特点如下:这一时期主要关注神经网络的基本理论和算法发展,包括前馈神经网络和卷积神经网络等。在应用领域,深度学习算法开始在图像识别和自然语言处理等领域进行初步探索。然而,由于计算能力的限制,深度学习在这一时期的发展相对缓慢。1980年代个人计算机和大规模计算的普及为深度学习的发展奠定了基础。

然而,从2010年代至今,随着计算能力和数据存储的快速增长,深度学习开始大规模应用于各个领域。云计算和GPU等技术的快速发展为深度学习提供了强大的计算支持,促进了技术突破。深度学习的应用范围不断扩大,广泛应用于自动驾驶、医疗诊断、金融风险评估等领域。同时,深度学习算法也逐渐发展成多种类型,如递归神经网络和生成对抗网络等。

深度学习(Deep Learning)是机器学习的一个分支,是一种基于人工神经网络的数据表征学习算法。它的主要特点包括:多层结构,使用多层神经网络来处理数据,通过逐层提取特征来学习复杂的表示;自动特征提取,能够从原始数据中自动学习特征,无需人工设计;强大的学习能力,能够处理大规模数据,并在图像识别、语音识别、自然语言处理等领域取得突破性成果;多种网络架构,包括卷积神经网络(CNN)、循环神经网络(RNN)、深度置信网络(DBN)等,适用于不同类型的任务;高度非线性,通过多层非线性变换,能够学习和表示复杂的数据模式;端到端学习,可以直接从原始输入到最终输出进行学习,无需中间步骤。

(2014年-2017年)生成对抗网络的突破

伊恩·古德费洛(Ian Goodfellow)出生于1987年,在斯坦福大学获得了计算机科学的学士和硕士学位,导师是吴恩达。随后,他在蒙特利尔大学获得机器学习博士学位,导师是约书亚·本希奥和亚伦·库维尔。2014年,它引入了生成对抗网络(Generative adversarial network,GAN),这是生成式人工智能领域的一个里程碑。

GAN有两个核心组件:生成器(Generator)和判别器(Discriminator)。生成器负责生成假数据,试图欺骗判别器;判别器则负责区分真实数据和生成的假数据。在对抗训练过程中,生成器不断学习生成更逼真的数据,而判别器则不断提高识别真假数据的能力。两个网络相互竞争,不断改进,最终目标是生成器能够产生与真实数据无法区分的假数据,而判别器将无法准确区分真假数据,只能随机猜测(50%概率)。简单来说,这种创新的框架包括两个互相对抗的网络:一个生成内容,另一个评估内容,推动了更为逼真和复杂输出的创造。

GAN在多个领域有广泛应用,包括图像生成(创建逼真的图像、提高图像分辨率等)、数据增强(为机器学习模型生成训练数据)、3D模型生成(根据2D图像生成3D模型)和艺术创作(生成新的艺术作品)。GAN的优势在于能够更好地建模数据分布,生成清晰、锐利的图像,并且理论上可以训练任何类型的生成器网络,无需使用马尔可夫链反复采样。然而,GAN的训练过程不稳定,容易出现模式崩溃等问题,并且需要大量计算资源。

得益于GANs和深度学习技术的进步,生成式人工智能的领域蓬勃发展。这一时期见证了生成模型的多样化,包括用于文本和视频生成的卷积神经网络(CNNs)和循环神经网络(RNNs),以及用于图像合成的变分自编码器(VAEs)和扩散模型的出现。大规模语言模型(LLMs)的发展始于GPT-1,展示了前所未有的文本生成能力,标志着该领域的重大飞跃。

(2017年-至今)快速扩展期

现在的生成模型不仅限于文本生成,还扩展到图像生成、音乐生成和视频生成等领域。以GPT系列为代表的大规模语言模型在自然语言处理方面取得了显著进展,能够生成高质量的文本内容。这些模型的成功展示了生成式人工智能在多个领域的广泛应用潜力。

ChatGPT 4.0 展示了令人印象深刻的自然语言理解和生成能力,能够处理复杂的对话、回答问题、撰写文章以及生成创意内容。其核心优势在于能够生成连贯且上下文相关的文本,这使得它在各种应用场景中得到了广泛使用,从客户服务到内容创作,再到编程助手。

MidJourney是一个基于生成式人工智能的图像生成平台,专注于从文本描述生成高质量的图像。用户只需输入简短的文本描述,MidJourney就能生成相应的图像,展示出生成式人工智能在视觉内容创作中的强大潜力。MidJourney的出现使得非专业用户也能够轻松创作出复杂的图像,为艺术创作、设计和媒体制作提供了新的可能性。

在今天的高科技时代,回顾ELIZA的故事和GAI的发展历程,我们不仅能看到技术进步的轨迹,也能反思人工智能与人类社会之间不断演变的关系。虽然ChatGPT等现代模型在功能和复杂性上超越了ELIZA,但正是这种最早的尝试,开启了我们对智能机器无尽可能性的探索之路。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1965077.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

day7 Excel教程——如何用单元格格式给表格化个妆?(超多干货)

day7 如何用单元格格式给表格化个妆? 目录 1. 单元格内容 Excel中单元格内容分为文本、数值、逻辑值。在没有任何格式下: 文本:左对齐,不能计算 数值:右对齐,可以计算 逻辑值:对/错&#xff0…

XR-Frame 计算相机与场景物体的距离

如下哦 const cameraTransform this.scene.getElementById(camera).getComponent(transform)const modelTransform this.scene.getElementById(yourNodeId).getComponent("transform");if (cameraTransform.worldPosition.distanceTo(modelTransform.worldPosition…

Simulink代码生成:基本算数运算

文章目录 1 引言2 模块使用实例2.1 Add模块2.2 Product模块2.3 Gain模块 3 代码生成4 总结 1 引言 算数运算是Simulink中的一种基本运算,对应C语言中的算数运算符,包括加、减、乘、除和取模运算。本文研究这几种运算在Simulink的使用,以及生…

微服务架构革新:百度Jarvis2.0与云原生技术的力量

作者 | 商业广告平台团队 导读 从十几个模块到上千个微服务,百度如何构建业界最复杂的微服务系统?Jarvis平台,十年磨一剑,集服务治理、配置管理、链路追踪于一体,打造云原生控制中心。Jarvis2.0,多运行时架…

大型分布式B2B2C多用户商城7.0企业版源码分享【java语言、方便二次开发】

项目介绍 项目基于SpringBoot开发,运营端和商户端采用ElementVue,买家使用采用VueIviewnuxt服务端渲染。使用到的中间件有Redis、RabbitMQ、ElasticSearch、FastDFS、Mongodb等。主要功能包括有运营管理、商品管理、订单管理、售后管理、会员管理、财务…

【PyQt5】一文向您详细介绍 QRadioButton() 的作用

【PyQt5】一文向您详细介绍 QRadioButton() 的作用 下滑即可查看博客内容 🌈 欢迎莅临我的个人主页 👈这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地!🎇 🎓 博主简介:985高校的普通本硕&am…

windows下安装gcc和make

目录 引言 第一种:自定义安装 下载和安装MinGw 将bin目录添加进环境变量 拷贝mingw-get.exe改名为make.exe 查看gcc和make命令是否安装成功 测试make和makefile 第二种:免安装,解压可用 下载mingw64 配置环境变量 拷贝mingw-get.e…

链码简介及MATLAB提取彩色图像链码

一、链码 链码(又称为freeman code)是一种通过带有给定方向的单位长度的线段序列来描述轮廓边界的方法,常被用来在图像处理、计算机图形学、模式识别等领域中表示曲线和区域边界。在二维图像中,链码可以表示为一系列的方向码,每个…

基于遗传算法的BP神经网络+代码解析

嗨,我是射手座的程序媛,期待和大家更多的交流与学习,欢迎添加3512724768。 基于遗传算法的BP神经网络代码解析 自己在2024年年初开始时,因为某些原因,了解到了基于遗传算法的神经网络。之前,对遗传算法并…

韦东山瑞士军刀项目自学之复习OS中断相关知识

和STM32无关,单纯是为了秋招复习一下中断的流程,其中涉及到内核态与用户态之间的转换,以及系统调用等等

开源免费软件一键瘦身你的Windows系统-Win11Debloat

开源免费软件一键瘦身你的Windows系统-Win11Debloat 前言 随着 Windows 11 的发布,许多用户发现系统中预装了大量的应用和功能,这些应用和功能可能会影响系统的性能和用户体验。为了帮助用户优化他们的 Windows 11 系统,可以使用一个名为 W…

VBA代码解决方案第十六讲:如何引用工作表(引用工作表的方式)

《VBA代码解决方案》(版权10028096)这套教程是我最早推出的教程,目前已经是第三版修订了。这套教程定位于入门后的提高,在学习这套教程过程中,侧重点是要理解及掌握我的“积木编程”思想。要灵活运用教程中的实例像搭积木一样把自己喜欢的代码…

Mybatis的写增删改查的方法

一、Mybatis环境配置: 环境的配置我在前面的文章里有详细写https://blog.csdn.net/daibadetianshi/article/details/140698718?spm1001.2014.3001.5501https://blog.csdn.net/daibadetianshi/article/details/140698718?spm1001.2014.3001.5501 二、方法之用注解…

探索有赞小程序:揭秘其强大的组件库功能!

有赞小程序组件库是针对有赞小程序开发者提供的一套组件,它提供了丰富的功能和样式,方便开发者快速搭建和定制各种有赞小程序页面。下面将从四个方面对有赞小程序组件库的功能做详细的阐述。 1、UI组件 可实时在线编辑的设计工具——即时设计https://a…

【C++】C++11之右值引用

目录 一、前言 二、概念 2.1 左值和左值引用 2.2 右值和右值引用 三、左值引用与右值引用的区别 四、应用场景 4.1 左值引用的短板(将亡值) 4.2 右值引用的意义(移动语义) 五、右值引用引用左值 六、万能引用和完美转发…

从零开始手写STL库:HashTable

从零开始手写STL库–HashTable的实现 Gihub链接:miniSTL 文章目录 从零开始手写STL库–HashTable的实现HashTable是什么HashTable需要包含什么函数基础成员部分基础函数部分可用函数部分 其他函数总结 HashTable是什么 HashTable在STL中直接出现的情况并不多&…

宝塔部署springboot vue ruoyi前后端分离项目,分离lib、resources

1、“文件”中创建好相关项目目录,并将项目相关文件传到对应目录 例如:项目名称/ #项目总目录 api/ #存放jar项目的Java项目文件 manage/ #vue管理后端界面 …

计网面试题

OSI七层模型 物理层,数据链路层,网络层,传输层,会话层,表示层,应用层 TCP/IP四层模型 应用层,传输层,网络层,网络层接口 HTTP(超文本传输协议)…

C语言典型例题20

《C程序设计教程(第四版)——谭浩强》 例题2.8 有两个整形变量a和b,将他们两个的值进行互换 代码: //《C程序设计教程(第四版)——谭浩强》 //例题2.8 有两个整形变量a和b,将他们两个的值进行…