GPT-5 终于来了 —— 人们的预期与现实

news2024/11/26 10:34:45

高智慧人工智能的两面性,利用AI和被AI利用

前言:人工智能的热度持续升温,似乎已无处不在,但大家对它的感知却并不显著。这种状况有点像美国 2024 年的总统大选,投票前人们彼此不清楚支持谁,直到最终计票才发现,原来大家心里支持的就是川普。我们总期待着一个更强大的人工智能,甚至幻想它在所有方面都超越人类。但事实上,我们也都明白,人工智能只是工具。我们并不渴望一个能够超越人类几百万年进化成果的工具。若人工智能真的凌驾于人类之上,它还能如何服务人类呢?因此,现在正是大规模应用人工智能的时机,而不是等它拥有超越人类的一切能力时再开始使用。若等到那时,不仅人类可能无力驾驭它,反而可能被它所制约,成为“工具的工具”。

回归本文的主题:微软工程师们准备在 2024 年 11 月把 Orion(GPT-5)部署到 Azure 上。它的确已经准备好上线了,但暂时不会对大众开放。

当 OpenAI 在 2023 年 3 月左右宣布他们在开发 GPT-5 时,大家产生了不少疑虑,一些著名人士甚至签署了一份请愿书,要求停止开发。确认签署的包括 AI 先锋 Yoshua Bengio(图灵奖得主)、AI 研究人员 Stuart Russell 和 Gary Marcus、苹果联合创始人 Steve Wozniak、美国前总统候选人 Andrew Yang,以及《原子科学家公报》主席 Rachel Bronson(反对会毁灭人类的核战争)。Tesla、Twitter 和 SpaceX 的 CEO、OpenAI 的前联合创始人 Elon Musk 也签了名,另外还有 Stability AI 的 CEO Emad Mostaque。

尽管 GPT-4 让 AI 能力有了显著提升,但它仍然有一些显著的局限性。它并没有引发大规模失业或是宣告人类的毁灭,这也意味着签署请愿书的那些人可能有点儿多虑了。

Orion 的阴影浮现:审慎的乐观

GPT-4 发布已经一年多了,而大家对 GPT-5(代号 Orion)的担忧也有所减轻。现在 Orion 终于准备向世界亮相了。与之前的发布不同,它一开始不会通过 ChatGPT 广泛开放。OpenAI 计划先让与其紧密合作的公司优先使用,以便他们开发自己的产品和功能。尽管在 OpenAI 内部,Orion 被视为 GPT-4 的继任者,但目前还不确定它会不会被公开称为 GPT-5。

有报告称 GPT-5 的性能会比之前强 100 倍,虽然这种“强大”的具体含义还不明确。然而,有些局限性是它永远也无法克服的。

首先,我们来看看最新 GPT 版本中存在的一些持续问题。

GPT-4o 的局限性与担忧:

• 语言局限性:尽管 GPT-4o 在多语言能力上有所提升,但在非英语语言上仍然有困难,尤其是那些缺乏高质量数据的语言,可能会导致应答和翻译效果不佳。

• 数据质量问题:一个值得关注的问题是训练数据质量较低,尤其是在中文等语言中,这可能让模型提供不准确或离谱的回答,因为低质量内容太多。

• 事实准确性:即使用户使用了特定的提示词,模型有时也会给出错误或误导性信息,这让人对它的可信度产生怀疑。

• 部分指令执行:即使用户给出一长串清晰简单的指令,LLMs 也可能只执行部分内容。对 AI 来说,这是一个复杂的新型指令集。模型可能会完成它在训练中识别的部分指令,但会跳过或简化其他部分。在得到反馈后,它可能会纠正之前遗漏的内容,但可能会忽略它之前已经完成的部分。

• 资源密集:训练和运行像 GPT-4o 这样的大语言模型需要大量计算资源,这限制了它的可获得性,也因其高能耗引发了环保问题。

• 社会偏见:GPT-4o 可能会无意中延续训练数据中的偏见,导致不公正或歧视性的回答,从而影响公众意见并加剧社会问题。

• 拟人化倾向:用“推理”和“理解”这样的词来描述 AI 模型,容易让人产生不切实际的期望和误解。虽然这样描述让用户更容易理解 LLM,但必须承认,这些模型只是根据模式预测词语,而不是像人类一样真正理解提示。

• 外部红队测试不足:目前的 70 多位专家可能还不足以有效应对所有潜在用户的多样化需求和相关风险。

• 缺乏透明度:OpenAI 没有提供足够的信息,比如关于可持续性指标、即将发布的功能、发布日期或产品路线图等关键方面的信息。

• 高级模型访问限制:可能只有少部分用户能访问到最强大的模型版本,且高昂的成本也让很多用户望而却步。

Orion:前进一步,还是老问题?

OpenAI 对 Orion 的计划充满了神秘感,关于其发布日期和功能的报告也互相矛盾(不过,这种神秘感对某些人来说反而更有吸引力)。尽管预计 Orion 会解决 GPT-4o 的一些缺点,但某些根本性的挑战可能依然存在。

对 Orion 的预期改进

• 事实校对增强:Orion 的一个改进可能是更好的事实校对能力。虽然像 GPT-4 这样的模型偶尔会给出不准确或自相矛盾的回答,Orion 希望通过引用更可靠的数据源并优化响应验证流程来减少这些错误。

• 视频处理增强:GPT-4 在视频内容的处理和理解上能力有限,应用在多媒体场景中有不少限制。而 Orion 预计会大幅提升视频理解和处理能力,可能支持实时视频分析、总结,甚至生成。

• 上下文记忆:Orion 预计会有更好的记忆能力,能够在更长的对话中保持上下文,从而让互动更连贯、更加考虑上下文关联,使模型能够记住对话中的细节并在长时间交流中加以应用。

• 高级多模态能力:尽管 GPT-4 引入了基本的多模态功能,可以处理文本和图像,Orion 可能会在此基础上进一步提升,能够无缝整合多种输入类型,比如文本、图像、视频,甚至音频。

• 伦理和偏见控制:像 Orion 这样的未来模型有望实施更复杂的机制来减少偏见和处理伦理复杂的情况。

• 企业的定制和微调:Orion 可能会允许企业在微调模型上有更多控制,使其能够更好地满足企业的特定需求。OpenAI 可能会提供更高级的 API 和工具,方便公司在客服、市场等场景中根据需要定制语言生成、调整语气和定制模型应答,从而实现更多用途。

• 实时语言翻译改进:Orion 预计会在 GPT-4 的语言翻译基础上进一步提升,力求实现实时的、情境准确的多语言翻译。

未来仍会面临的挑战

未来版本的 GPT 模型预计仍会面临一些问题:

• 数据质量问题:模型依赖于网络规模的数据,而这些数据通常带有偏见和错误,这是一个持久性问题。

• 非英语语言的挑战:尽管在改善非英语语言的响应质量上有努力,但由于高质量训练数据和技术人员稀缺,这些语言的表现可能仍然有限。

• 部分指令执行:即使是简单清晰的指令对 LLM 来说也会变得复杂,特别是当包含多项约束时。LLM 可能会选择它们识别的最接近的模式,往往忽略一些指令。这个局限性可能无法彻底解决。

• 资源密集性:驱动 GPT 模型的 Transformer 架构需要大量资源,这一问题预计会持续。根据报道,如果新数据中心依赖核能,可能会带来全球变暖加速或核废料风险增加等环境灾难。

• 社会偏见的延续:模型的训练数据主要来源于网络,如果不优先考虑高质量、无偏见的资源,这些偏见可能会进一步加深,突显 OpenAI 在数据采集实践中的局限性,也需要更仔细地挑选训练数据。

未来发展路径

为了解决这些局限性,确保 AI 的负责任发展,可能需要采取以下几步:

• 新的语言模型:我们需要一个资源高效的新语言模型,能够有效地学习而无需为每种语言的所有使用场景和细微差别收集大量数据。

• 高质量数据:为了减轻偏见和错误,必须投入创建和策划多样化的高质量数据集,包括谨慎选择数据来源,去除偏见,确保数据的完整性。

• 透明度与责任:OpenAI 和其他 AI 开发者应该在研究开发过程中优先考虑透明度。通过分享模型的局限性、偏见和潜在影响的信息,可以增强公众信任,并引发关于 AI 在社会中作用的讨论。

• 用户教育:教育公众 AI 的能力和局限性有助于管理期望,防止误用。

• 监管监督:政府和国际组织在 AI 开发和部署的监管中扮演重要角色。通过建立适当的监管制度,可以在创新和安全之间取得平衡,监管重点应放在数据隐私、算法公平性和责任上。

为了实现平衡的增长,我们必须确保 AI 的发展是合作的,而不是被少数人主导。公平竞争和透明是推动进步的关键,而不是盲目地宣传。通过真实地讨论挑战和问题,我们可以为人类造福,合理利用 AI 的力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2237588.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微服务透传日志traceId

问题 在微服务架构中,一次业务执行完可能需要跨多个服务,这个时候,我们想看到业务完整的日志信息,就要从各个服务中获取,即便是使用了ELK把日志收集到一起,但如果不做处理,也是无法完整把一次业…

Matlab实现鲸鱼优化算法优化随机森林算法模型 (WOA-RF)(附源码)

目录 1.内容介绍 2.部分代码 3.实验结果 4.内容获取 1内容介绍 鲸鱼优化算法(Whale Optimization Algorithm, WOA)是受座头鲸捕食行为启发而提出的一种新型元启发式优化算法。该算法通过模拟座头鲸围绕猎物的螺旋游动和缩小包围圈的方式,在…

【学习笔记】网络设备(华为交换机)基础知识 10 —— 信息中心 ① 简介

提示:学习华为交换机信息中心的概述( 包括信息中心的概念、功能、以及信息的分类、分级、和输出 ) ;还包括信息中心常用的命令 ( 使能信息中心、命名信息通道、配置信息过滤、清除统计信息、查看信息中心相关信息的命令…

【unity】unity2021 URP管线下 SceneView没有MipMaps选项了怎么办?扩展Rendering Debugger工具

一、前言 之前项目 Unity打开后 Scene窗口 有一个MipMaps选项模式, 可以查看哪些贴图正常距离下发红 ,说明用不到那么大,可以缩一下尺寸。 但 新的项目在Unity2021上,用了URP, 就没见过这个选项。 查了一篇介绍详细的…

前端代码分析题(选择题、分析题)——JS事件循环分析、await和作用域分析

Promise其实也不难-CSDN博客 Promise 的执行顺序分析 Promise 对象的执行是异步的,但其执行器函数内部的代码是立即执行的,而 then方法注册的回调函数则是在 Promise 状态改变后执行的。 const myPromise new Promise((resolve, reject) > {conso…

DAY24|回溯算法Part03|LeetCode:93.复原IP地址、78.子集、90.子集II

目录 LeetCode:93.复原IP地址 基本思路 C代码 LeetCode:78.子集 基本思路 C代码 LeetCode:90.子集II 基本思路 C代码 通过used实现去重 通过set实现去重 不使用used和set版本 LeetCode:93.复原IP地址 力扣代码链接 文字讲解:LeetCode:93.复原IP地…

ts 将100个元素,每行显示9个元素,然后显示出所有行的元素,由此我们延伸出一个项目需求的简单算法实现。

1、先看一下baidu ai出的结果&#xff1a; 2、我们将上面的代码修改下&#xff0c;定义一个数组&#xff0c;然后记录每行的行号及相应的元素&#xff1a; <template><div>console</div> </template> <script setup lang"ts"> import …

17、论文阅读:VMamba:视觉状态空间模型

前言 设计计算效率高的网络架构在计算机视觉领域仍然是一个持续的需求。在本文中&#xff0c;我们将一种状态空间语言模型 Mamba 移植到 VMamba 中&#xff0c;构建出一个具有线性时间复杂度的视觉主干网络。VMamba 的核心是一组视觉状态空间 (VSS) 块&#xff0c;搭配 2D 选择…

用 Python 从零开始创建神经网络(三):添加层级(Adding Layers)

添加层级&#xff08;Adding Layers&#xff09; 引言1. Training Data2. Dense Layer Class 引言 我们构建的神经网络变得越来越受人尊敬&#xff0c;但目前我们只有一层。当神经网络具有两层或更多隐藏层时&#xff0c;它们变成了“深度”网络。目前我们只有一层&#xff0c…

推荐一款功能强大的视频修复软件:Apeaksoft Video Fixer

Apeaksoft Video Fixer是一款功能强大的视频修复软件&#xff0c;专门用于修复损坏、不可播放、卡顿、画面失真、黑屏等视频问题。只需提供一个准确且有效的样本视频作为参考&#xff0c;该软件就能将受损视频修复到与样本视频相同的质量。该软件目前支持MP4、MOV、3GP等格式的…

Web前端开发--HTML语言

文章目录 前言1.介绍2.组成3.基本框架4.常见标签4.1双标签4.1.1.标题标签4.2.2段落标签4.1.3文本格式化标签4.1.4超链接标签4.1.5视频标签4.1.6 音频标签 4.2单标签4.2.1换行标签和水平线标签4.2.2 图像标签 5.表单控件结语 前言 生活中处处都有网站&#xff0c;无论你是学习爬…

[ DOS 命令基础 2 ] DOS 命令详解-网络相关命令

&#x1f36c; 博主介绍 &#x1f468;‍&#x1f393; 博主介绍&#xff1a;大家好&#xff0c;我是 _PowerShell &#xff0c;很高兴认识大家~ ✨主攻领域&#xff1a;【渗透领域】【数据通信】 【通讯安全】 【web安全】【面试分析】 &#x1f389;点赞➕评论➕收藏 养成习…

gitlab无法创建合并请求是所有分支都不显示

点击Merge Requests ------> New merge request 创建新的合并请求时&#xff0c;在Source branch和Target branch中一个分支都不显示 排查思路&#xff1a; 1.怀疑是权限问题。 发现只有我的一个账号出现&#xff0c;检查了账号的权限&#xff0c;尝试了master、develop角色…

【温度表达转化】

【温度表达转化】 C语言代码C代码Java代码Python代码 &#x1f490;The Begin&#x1f490;点点关注&#xff0c;收藏不迷路&#x1f490; 利用公式 C5∗(F−32)/9 &#xff08;其中C表示摄氏温度&#xff0c;F表示华氏温度&#xff09; 进行计算转化。 输出 输出一行&#x…

「QT」几何数据类 之 QPoint 整型点类

✨博客主页何曾参静谧的博客&#x1f4cc;文章专栏「QT」QT5程序设计&#x1f4da;全部专栏「VS」Visual Studio「C/C」C/C程序设计「UG/NX」BlockUI集合「Win」Windows程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「PK」Parasolid…

[Linux]:高级IO

1. IO 理解 1.1 IO 的基本概念 I/O即输入/输出&#xff08;input/output&#xff09;&#xff0c;是计算机系统中极为关键的操作环节。 在经典的冯诺依曼体系结构框架下&#xff0c;其核心在于数据的传输流向界定了输入与输出的概念。具体而言&#xff0c;当把数据从诸如键盘…

【GeoJSON在线编辑平台】(2)吸附+删除+挖孔+扩展

前言 在上一篇的基础上继续开发&#xff0c;补充上吸附功能、删除矢量、挖孔功能。 实现 1. 吸附 参考官方案例&#xff1a;Snap Interaction 2. 删除 通过 removeFeature 直接移除选中的要素。 3. 挖孔 首先是引入 Turf.js &#xff0c;然后通过 mask 方法来实现挖孔的…

【ReactPress】React + antd + NestJS + NextJS + MySQL 的简洁兼时尚的博客网站

ReactPress 是使用React开发的开源发布平台&#xff0c;用户可以在支持React和MySQL数据库的服务器上架设属于自己的博客、网站。也可以把 ReactPress 当作一个内容管理系统&#xff08;CMS&#xff09;来使用。 前言 此项目是用于构建博客网站的&#xff0c;包含前台展示、管理…

ZISUOJ 2024算法基础公选课练习一(1)

前言、 又是一年算法公选课&#xff0c;与去年不同的是今年学了一些纯C&#xff08;而不是带类的C&#xff09; 一、我的C模板 1.1 模板1 #include <bits/stdc.h> using i64 long long;int main() {std::cin.tie(nullptr)->sync_with_stdio(false);return 0; } 1…

【1】虚拟机安装

1.安装VMware WorkStation Pro VMware下载地址&#xff1a; 密钥&#xff1a;YF390-0HF8P-M81RQ-2DXQE-M2UT6 2.新建虚拟机 centos7下载地址&#xff1a;centos-7.9.2009-isos-x86_64安装包下载_开源镜像站-阿里云