从认知智能的角度认识ChatGPT的不足

news2024/9/30 9:20:59

OpenAI的ChatGPT带来了一些令人欣喜的成果,但是从认知智能的角度来看,也有很多不足。今天我就来为大家说一说。首先我会为大家简单介绍人工智能,认知智能,然后再分析ChatGPT的能力和不足,最后分享目前优秀的学术论文以便让想了解原理的朋友获得深刻的认识。

什么是认知智能?

人工智能是完整地感知、认知、决策和执行整个过程的人工处理机制。

关于人工智能的详细范畴,先请大家看一些信息。首先我们来看ACM和IEEE-CS联合工作组正在制定的人工智能知识模块及知识点。

图片来源:中国人工智能学会。中国人工智能知识点全景图:迈向“智能+”时代蓝皮书。表4 ACM和IEEE-CS联合工作组正在制定的人工智能知识模块及知识点。2022年8月

更具体地,来看看《人工智能引论》知识点模块结构。

图片来源:中国人工智能学会。中国人工智能知识点全景图:迈向“智能+”时代蓝皮书。图6《人工智能引论》知识点模块结构2022年8月

接下来我和大家说说认知能力。认知能力是指人脑加工、储存和提取信息的能力,即人们对事物的构成、性能与他物的关系、发展的动力、发展方向以及基本规律的把握能力。它是人们成功地完成活动最重要的心理条件。知觉、记忆、注意、思维和想象的能力都被认为是认知能力。思维包括直觉、形象思维、抽象思维、灵感思维,人的思维活动包括分析与综合、比较与分类、抽象与概括,具体化与系统化等内容。具体来说,包括理解、思考和推理。

人工智能发展经历了以下的阶段,简单来说如下

1 计算智能:能存会算

2 感知智能:能听会说、能看会认

3 认知智能:理解、思考和推理。

目前我们正在进入认知智能阶段。认知智能(计算)是技术及产品的中枢神经系统,其感知人、物、事件、环境,并进行数据分析与决策。认知智能的关键特征是对人类智能的模拟、对模糊数据与问题的高效处理、对不确定数据与问题的高效处理。

认知智能的特点

图片为我本人绘制。内容来自于https://www.techtarget.com/searchenterpriseai/definition/cognitive-computing

更一般地,我们从强弱人工智能的角度来看,强人工智能具备推理和解决问题的能力有知觉和自我意识,弱人工智能解决单一、特定的工作问题,不能具备推理和解决问题的能力。

有兴趣,大家还可以进一步了解认知智能和情感智能的区别。

图片来源:https://thinkpsych.com/blog/cognitive-vs-emotional-intelligence/

ChatGPT的能力

图片来源:https://openai.com/blog/chatgpt/

Yao Fu等于2022年12月在How doesGPT Obtain its Ability? Tracing Emergent Abilities of Language Models to theirSources 这篇文章里总结了ChatGPT背后的GPT-3和GPT-3.5的能力,并解释这些能力是如何产生的。

1语言生成能力+基本世界知识+语境中的学习是来自于预训练(`davinci')。
2储存大量知识的能力来自175B参数的神经网络。
3遵循指令和归纳新任务的能力来自于规模化指令调整(`davinci-instruct-beta`)。
4进行复杂推理的能力可能来自于代码的训练(`code-davinci-002`)。
5产生中立、客观、安全和信息丰富的答案的能力来自与人类的一致性。具体来说。
如果是监督调整,产生的模型是 "text-davinci-002"。
如果是RLHF,产生的模型是"text-davinci-003"。
无论是监督还是RLHF,这些模型在很多任务上都无法超越code-davinci-002,这被称为the alignment tax。
6对话能力也来自RLHF(`ChatGPT'),具体来说,它是对上下文学习的权衡。
建立对话历史模型
增加信息量
拒绝模型知识范围之外的问题

如果想了解具体信息,可以收听以下我的音频。

ChatGPT是如何工作的?

GPT3和GPT3.5的能力是如何产生的?

ChatGPT的核心技术:语境学习1

关于语境学习In-contextlearning,可参考北京大学的QingxiuDong等写的一篇综述文章A Survey on In-contextLearning 作者为QingxiuDong , Lei Li , Damai Dai, Ce Zheng, Zhiyong Wu等) ,语境学习的核心思想是类比学习。

关于思维链Chainof Thought,可查看 FaithfulChain-of-Thought Reasoning

关于指令学习Instructiontuning,可查看打开模型Zero-Shot新范式:InstructionTuning和Training language models to followinstructions with human feedback

关于基于人类反馈的强化学习ReinforcementLearning from Human Feedback,可查看Illustrating Reinforcement Learningfrom Human Feedback (RLHF)。

ChatGPT的不足

Ali Borji在A Categorical Archive of ChatGPTFailures这篇文章里用具体的例子从推理、逻辑、事实错误、数学和算术、偏见和歧视、智慧和幽默、程序编码、句法结构、拼写和语法、自我意识、以及个性化十个方面指出了ChatGPT的不足。

大家可以听听我的音频。

从认知智能的角度看ChatGPT的不足(上)

从认知智能的角度看ChatGPT的不足(下)

ChatGPT能做什么和不能做什么

总之,ChatGPT可以如OpenAI的官网所说,完成信息性、中立的回应,并且拒绝不恰当的问题和超出其知识氛围的问题。该模型在逻辑和模棱两可的语句的混合含糊推理上可以做得非常好,但是不能做非常严格的推理:例如推导出严格的证明,要求在中间步骤中没有错误。

经过以上的总结,我们知道ChatGPT有一些初步的认知能力,例如可以理解一些简单的问题并且做出类人的表达,但是由于无法理解概念,缺乏个性化的表达,不能进行数学和一阶逻辑推理。所以并没有类人的认知智能。我个人认为要发展ChatGPT,只有情景学习、思维链、指令学习和基于人类反馈的强化学习是远远不够的,需要充分利用心理学、学习理论、脑科学、神经科学和认知科学的成果,而不是只局限在基于数学的算法这个层面。

参考资源

如果想了解基本原理,建议认真读完以下的文章,应该能收获不少。

  • Stephen Wolfram,2023年2月14日What IsChatGPT Doing … and Why Does It Work? 中文版:ChatGPT 在做什么… 以及它为何发挥作用?

  • How doesGPT Obtain its Ability? Tracing Emergent Abilities of Language Models to theirSources

  • 赛尔笔记 | 浅析ChatGPT的原理及应用

  • https://github.com/openai/following-instructions-human-feedback

  • Ali Borji,ACategorical Archive of ChatGPT Failures 中文版:ChatGPT,不得不说的十大能力缺陷

  • Ouyang, Long, et al. Training language models to followinstructions with human feedback

  • Illustrating Reinforcement Learningfrom Human Feedback (RLHF)

大家也可以看看台湾大学李宏毅教授的解释视频

近日爆火的【ChatGPT】是怎么炼成的? GPT社会化的过程

欢迎留言,与我交流认知计算和认知智能的发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/373358.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网络应用之静态Web服务器

静态Web服务器-返回固定页面数据学习目标能够写出组装固定页面数据的响应报文1. 开发自己的静态Web服务器实现步骤:编写一个TCP服务端程序获取浏览器发送的http请求报文数据读取固定页面数据,把页面数据组装成HTTP响应报文数据发送给浏览器。HTTP响应报文数据发送完…

[11]云计算|简答题|案例分析|云交付|云部署|负载均衡器|时间戳

升级学校云系统我们学校要根据目前学生互联网在线学习、教师教学资源电子化、教学评价过程化精细化的需求,计划升级为云教学系统。请同学们根据学校发展实际考虑云交付模型包含哪些?云部署采用什么模型最合适?请具体说明。9月3日买电脑还是租…

python之并发编程

一、并发编程之多进程 1.multiprocessing模块介绍 python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_count()查看),在python中大部分情况需要使用多进程。Python提供了multiprocessing。 multiprocess…

SEO优化:干货技巧分享,包新站1-15天100%收录首页

不管是老域名还是新域名,不管是多久没有收录首页的站,此法周期7-30天,包首页收录!本人不喜欢空吹牛逼不实践的理论,公布具体操作:假如你想收录的域名是a.com,那么准备如下材料1.购买5-10个最便宜…

【Tomcat】Tomcat安装及环境配置

文章目录什么是Tomcat为什么我们需要用到Tomcattomcat下载及安装1、进入官网www.apache.org,找到Projects中的project List2、下载之后,解压3、找到tomcat目录下的startup.bat文件,双击之后最后结果出现多少多少秒,表示安装成功4、…

【Python工具篇】Anaconda中安装python2和python3以及在pycharm中使用

背景:已经安装好anaconda、python3、pycharm,因为项目使用的是python2语法,所以需要在anaconda中安装python2,并在pycharm中使用,下面给出步骤。 1. 打开cmd或者是Anaconda Prompt。 下面是anaconda prompt. 2. 查…

hadoop03-MapReduce【尚硅谷】

大数据学习笔记 MapReduce 一、MapReduce概述 MapReduce是一个分布式运算程序的编程框架,是基于Hadoop的数据分析计算的核心框架。 MapReduce处理过程为两个阶段:Map和Reduce。 Map负责把一个任务分解成多个任务;Reduce负责把分解后多任务处…

必应ai注册方法

1.进行配置下载Microsoft Edge Canary,链接下载 Microsoft Edge Insider Channels,打开Microsoft Edge Canary,在Header Editor - Microsoft Edge Addons中安装Header Editor插件,点击Header Editor图标,选择右下角的&…

网页唤起 APP中Activity的实现原理

疑问的开端大家有没有想过一个问题:在浏览器里打开某个网页,网页上有一个按钮点击可以唤起App。这样的效果是怎么实现的呢?浏览器是一个app;为什么一个app可以调起其他app的页面?说到跨app的页面调用,大家是…

python之面向对象编程

1、面向对象介绍: 世界万物,皆可分类 世界万物,皆为对象 只要是对象,就肯定属于某种类 只要是对象,就肯定有属性 2、 面向对象的几个特性: class类: 一个类即对一类拥有相同属性的对象的…

STM32笔记

目录 1.1. 预备阶段 1.2. 单片机介绍 2. 初识STM32 2.1. STM32 1.1. 预备阶段 1.2. 单片机介绍 1.2.1. 单片机是什么 单片微型计算机(Single Chip Microcomputer)简称为单片机(Microcontrollers),也称为微控制单元(Microcontroller Uni…

Python对遥感影像重采样,以及重采样方法

首先,本次重采样使用的是GDAL方法完成 参考了以下博客,并根据自己的需要进行了删改以及原理的探究: 重采样:栅格影像重采样 我使用了下该代码,发现是可行的,但是仍然存在一定的问题,即他的采样…

【java web篇】Maven的基本使用以及IDEA 配置Maven

📋 个人简介 💖 作者简介:大家好,我是阿牛,全栈领域优质创作者。😜📝 个人主页:馆主阿牛🔥🎉 支持我:点赞👍收藏⭐️留言&#x1f4d…

Redis高级-主从复制相关操作

2.1 主从复制简介 2.1.1 高可用 首先我们要理解互联网应用因为其独有的特性我们演化出的三高架构 高并发 应用要提供某一业务要能支持很多客户端同时访问的能力,我们称为并发,高并发意思就很明确了 高性能 性能带给我们最直观的感受就是:速…

西北工业大学大学物理(I)下期末考试2021-2022选填解析

11 告诉你n2了,那么l0或者1,后续限制类推。2 几乎每年都出。散射波波长的偏移只与散射角有关。3 产生激光的条件。先认识到激光就是受激幅射光放大。受激辐射是产生激光的必要条件,粒子数偏转是产生激光的必要条件,谐振腔也需要。…

速来~与 Werner Vogels 博士一起探索敏捷性与创新速度一起提升的秘方

Amazon Web Services 的现代应用程序创新一直是 Amazon 公司坚持追求的核心目标。约20年前,我们经历了一次彻底的转型,旨在建立起“发明、发布、再发明、再发布、重新开始、洗牌、再重复”的快速迭代流程。正是此番探索,彻底改变了我们构建应…

OAK相机如何将yoloV8模型转换成blob格式?

编辑:OAK中国 首发:oakchina.cn 喜欢的话,请多多👍⭐️✍ 内容可能会不定期更新,官网内容都是最新的,请查看首发地址链接。 ▌前言 Hello,大家好,这里是OAK中国,我是助手…

Paddle配置

目录: 1.激活环境 2.版本选择 突发情况:ModuleNotFoundError: No module named paddle 检验是否安装成功 1.激活环境 Anaconda: conda remove -n paddle --all conda activate paddle 2.版本选择 打开链接:https://www.pa…

银行数字化转型导师坚鹏:BLM银行数字化转型战略课程大纲

BLM银行数字化转型战略——以BLM模型为核心,实现知行果合一 课程背景: 很多银行存在以下问题: 不知道如何系统地制定银行数字化转型战略? 不清楚其它银行数字化转型战略是如何制定的? 不知道其它银行数字化转型战略…

【离线数仓-8-数据仓库开发DWD层设计要点-工具域互动域流量域用户域相关事实表】

离线数仓-8-数据仓库开发DWD层-工具域&互动域&流量域&用户域相关事实表离线数仓-8-数据仓库开发DWD层设计要点-工具域&互动域&流量域&用户域相关事实表一、工具域相关事实表1.工具域优惠券领取事务事实表&使用(下单)事务事实…