如何评价一个新技术——以 ChatGPT 为例

news2024/12/26 11:25:08

613a6386358b1b4e022afbbb15d7231e.png

开源社KAIYUANSHE

近期微信公众号订阅功能做调整啦!

没有被星标的账号在信息流里可能不显示大图了!

快星标⭐我们,就可以及时看到发布的文章啦!

4a0584f8aebcec092b26ffe6d47e37d6.jpeg

STEP01 点击右上角标志

2eeeb7a44ce66b0e2552a6af973f3cd5.jpeg

STEP02 点击【设为星标】

缘起

2015 年的时候,我写过一篇文章《如何评价一个新技术——以 Docker 为例》,今天打算按照类似的风格,评价一下最近异常火爆的 ChatGPT。

八年以前,我对于 Docker 做出了极高的评价,我认为 Docker 是比 Java 更加重要的技术进步。现在看来,也基本上没有说错。Docker 开启了云原生时代,促使 Google 开源了 K8S。虽然 Docekr 这家公司似乎已经不再重要,但是容器技术,云原生技术,已经改变了整个行业。

现在,ChatGPT 出现了,以较之当年更加快的速度,火爆、流行、出圈,引发资本追捧,也引发各种担忧,似乎全世界都在讨论。当然,也有一些不以为然的言论,认为:不能神话、不该高估、不过如此等等。所以,应该如何来看待这样一种新技术呢?

首先,ChatGPT到底是什么?

之前想要评价 Docker 还是比较简单的,因为当时大家一眼就能明白,Docker 到底是什么。但是,ChatGPT 到底是什么呢?我最近密集的看了好多篇文章、好多个介绍视频、参与了微信群与 Twitter 上的好多轮讨论,最大的感受就是:“盲人摸象”。

有各种比喻,比较出名的比喻有:已经初具雏形的通用人工智能(张俊林),模糊的有损压缩(特德·姜),剽窃能手(乔姆斯基),互联网时代刚刚诞生的浏览器(王建硕),猜题专家(N 篇微信公众号)等等。

看了这么多盲人摸象的文章,我虽然依然不知道如何定义/定位 ChatGPT,但是至少我知道:ChatGPT 是大象那个级别的。

我关注ChatGPT的哪些特征

网上现在流传着很多与 ChatGPT 的对话截图,大家都喜闻乐见。毕竟无论是惊人还是搞笑,无聊还是浅薄,都是值得大家去围观的新事物。不过,我们应该琢磨得更加深一些,看看那些对话的表象,到底体现了一些什么重要的特征?而这些特征是以前的对话式 AI,所不具备的。

01

对话能力

2月12日我在twitter上与人讨论,有了一个猜想:ChatGPT学习的单位,应该不是“文本”,而是“一个场景下的多轮对话”,所以他的自然对话能力本来就极强,经过这一个多月的人类调教,他肯定会变得更强。

但是,这个背后的一些观点,在 twitter上没法展开。

  • 我曾经提出过一个机器学习的语料来源,就是开源社区里的 PR,包括:代码提交 Diff,围绕各种评论,不断的改进,然后代码是否被合入。这样的一个讨论串,有代码,有自然语言,有针对具体代码行的评论,有代码前后的变化,有最终的判别

    结果。如果机器能够学习这样的素材,自然能够更好的提供编程的建议。

  • 推广到社交网络上的各种素材,其实 BBS,Blog,邮件列表,各种聊天室,社交网络等等地方,到处都在发生着对话。

  • 这些对话不是单一内容,单一场景,单一语言的(很可能是混杂,甚至不断跑题的)

  • 这些对话展现的是人类互相理解,各自表达,互相交流的过程

  • 在 ChatGPT 推出之后,这个过程发生在人机之间,每一次的对话(这个在 ChatGPT 的界面上分得非常清楚),每次人类对于对话的评价(有点赞按钮),都是人们在帮助 ChatGPT 在继续训练

  • 人们在对话中纠正 ChatGPT 的内容,同样也是训练输入

我们一直在讨论的是 AIGC,在讨论 ChatGPT 生成的内容如何如何。但是,真正应该关注的是:ChatGPT 的对话能力,是使用 AI 增强的。

02

多语言模型的威力

我曾经问过 ChatGPT 一个问题:英文语料的增加,是否能够帮助你的中文能力提升?

他的回答是:是的,英文语料的增加也可以帮助 ChatGPT 的中文能力提升。作为一种多语言的语言模型,ChatGPT 可以同时学习多种语言的语法和语义。如果 ChatGPT 在训练过程中接触到大量的英文语料,它就会学习到英文语法和语义,从而增强它对中文语言的理解能力。请注意,模型的多语言能力不同于它的语言翻译能力,它仍然需要通过大量专业的翻译语料来增强翻译能力。

看了这样的回答,我们可以关注和分析以下一些内容:

  • ChatGPT 采用多语言模型

  • 其实不仅仅是多种自然语言,而是多种自然语言,加多种编程语言,再加多种“人造语言”(比如:Markdown、XML、CSS、CSV 之类)

  • 这么多种类的语言,在 GPT 3.5 内部,应该是能够互相促进,互相增强的一个整体

  • 代码与语言的混合输入输出,多语言之间的翻译,都是 ChatGPT 基于统一的模型产生的能力

  • 例如:ChatGPT 的翻译不是“准确翻译”,是“意译”,这个其实更加厉害

  • 再注意他回答的最后一句:“模型的多语言能力不同于它的语言翻译能力,它仍然需要通过大量专业的翻译语料来增强翻译能力”

  • 在 ChatGPT 使用的各种语言料中,是进行分类的

  • 不同种类的语料,各有专长,但是又能互相增强

  • 这句话,是他自己想到要说的,我的问题中,其实不包含翻译能力的提问。我只能猜测,在其他的多轮对话中,已经有无数人,问过 ChatGPT 的翻译能力从何而来的问题了。

03

通用智能

人类之间的对话,其实可能讨论任何事情。但是,在过去的人机对话中,我们往往会预设:这个 AI 只能回答某些种类的问题。但是,由于 ChatGPT 的语料,可能是任何现存的人类对话实例,所以:我们也可以预期:各种类型的对话,都可以尝试与 ChatGPT 交流试试。

至于人机交流的效果,取决于这一类对话的语料数量与质量。所以,现在大家都在探索,能够与 ChatGPT 之间,聊些什么。这会很有趣,也可能会令人“悚然而惊”。

我比较认同张俊林的判断:ChatGPT 已经可以被认为是一种通用人工智能。就是由于这种通用对话能力,简言之:他什么都能跟你聊一聊,而且有很大的概率:这些聊天还有点价值。无论我们如何评价他的“套话”,至少他不是在说“空话”,不是像某些聊天机器人,只会抬杠或者胡扯。

04

填补空白与启发思考

前几天,我与 ChatGPT 聊了一下 开源学的问题。说实话,我是非常吃惊的。因为:根本就还没有开源学这门学科,最多就是我们一群开源人,在一个非常小的圈子里,在做一些早期的尝试而已。

在我看来,这意味着 ChatGPT 能够填补空白。在人类已经发展出来的学科 A 与学科 B 之间,存在着交叉学科的可能性,而这样的可能性,通过与 ChatGPT 交流,启发思考,是很有价值的。

3114e6d3b64a40da58e16493df4c11bd.png

评价一种新技术的三要素

在 8 年前的文章中,我其实是为 Docker 度身定制了三个标准,现在也可以试试看能不能套用来评价 ChatGPT。

01

提升效率

当然,ChatGPT 极大的提升了我们的工作效率,而且是在我们的很多在以前不得不自己去完成的那些无聊、琐碎的事物性工作时(比如,写周报)非常明显。当然,还有人用他来干各种各样的工作,都取得了或多或少的成果。

不过,ChatGPT 并不会为内容的真实性负责,所以如果自己不做核查,甚至刻意造假的话,也会带来复杂、困难的真实性困扰。

02

增加选择

在 ChatGPT 出现之前,我们原本在做的一些事情,比如:搜索、学习英语、找朋友聊天,现在可能都只需要和 ChatGPT 聊聊。当然,在 Bing+ChatGPT 推出之后,这样的搜索可能会让人从 Google,转身投向 Bing 的怀抱。

确实,选择比以前更多了(对 Google 不是啥好消息)

03

降低门槛

ChatGPT 的易用性,与用途的广泛性,大家降低了使用 AI 的门槛。虽然最快达到 1 亿用户量,可能是一个虚假的(过于夸大的)数字。但是,铺天盖地的用户涌入 ChatGPT,开始与其聊天,肯定是不争的事实。

但是,这样的评价标准,对于 ChatGPT 来说,根本就不足以衡量其重要性。

评价一种新技术的另外一套三要素

这个其实是当初那篇文章的最后一段题外话,用来评价 Docker,已经有点过了,不过对于 ChatGPT 倒是正好。

01

从量变到质变

Docker 事实上已经引发了质变,整个 IT 研发、DevOps 都随之发生变化。而 ChatGPT,从此改变人工智能的本质,甚至改变 IT 产业的本质,都是可以想见的了。

02

创造一个新行业,甚至更多行业

Docker 创造的行业还不多,也许 YAML 配置工程师算一个。不过,我们可以预感到:ChatGPT 提供的 API,可以催生更多的 AI 应用,这个领域将广阔得难以想象。

03

危害性

  • AIGC 的危害,到了能够以假乱真的 ChatGPT 出现之后,进入了一个新的阶段

  • 多家科研期刊,已经明确禁止 ChatGPT 参与的论文写作与投稿

  • 已经有专家在非常严肃的讨论:AI 失业问题

总结

ChatGPT 的出现,是一个远比 Docker 的出现重要的事件。也许是“新工业革命”级别的信号!下一个节点,也许就是 AI 能够找到方法:自我训练,自我调优,自行进化。

由于GPT 4,甚至 GPT 5 也并非AI技术发展的天花板,因此在未来的 5~10 年,我们需要非常非常关注这个领域,其他所有的技术领域的重要性,都必须往后排了。

PS. 区块链、元宇宙、Web3 之类的技术,真的没那么重要了。

作者 | 庄表伟

编辑 | 李佳阳

相关阅读 | Related Reading

b0531d097fc35446ab1a3a1f09a1b083.jpeg

开源企业出海|2023“狮”在必行,带你一览新加坡科创生态

d16c7a254d9b5761a7306443c279b75b.jpeg

黑客与顾客:开源软件能商业化吗?

开源社简介

开源社成立于 2014 年,是由志愿贡献于开源事业的个人成员,依 “贡献、共识、共治” 原则所组成,始终维持厂商中立、公益、非营利的特点,是最早以 “开源治理、国际接轨、社区发展、开源项目” 为使命的开源社区联合体。开源社积极与支持开源的社区、企业以及政府相关单位紧密合作,以 “立足中国、贡献全球” 为愿景,旨在共创健康可持续发展的开源生态,推动中国开源社区成为全球开源体系的积极参与及贡献者。

2017 年,开源社转型为完全由个人成员组成,参照 ASF 等国际顶级开源基金会的治理模式运作。近九年来,链接了数万名开源人,集聚了上千名社区成员及志愿者、海内外数百位讲师,合作了数百家赞助、媒体、社区伙伴。

c4e10f665e1caa6cd92a9ec3d8d213a0.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/354178.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DaVinci 偏好设置:用户 - UI 设置

偏好设置 - 用户/ UI 设置Preferences - User/ UI Settings工作区选项Workspace Options语言Language指定 DaVinci Resolve 软件界面所使用的语言。目前支持英语、简体中文、日语、西班牙语、葡萄牙语、法语、俄语、泰语和越南语等等。启动时重新加载上一个工作项目Reload last…

Python 连接数据源与邮件功能(九)

文章目录一、概述二、Python 连接数据源1)Python MySQL 基础操作1、部署MySQL2、MySQL Connector 库【1】安装 mysql-connector-python 库【2】连接 MySQL【3】增加数据【4】查询数据【5】更新数据【6】删除数据2、PyMySQL 库【1】安装 PyMySQL 库【2】连接 MySQL【…

2023年数学建模美赛D题(Prioritizing the UN Sustainability Goals):SDGs 优先事项的选择

正在写,不断更新,别着急。。。 4. SDGs 优先事项的选择 4.1 基于SDG密度分布图选择优先事项 虽然每个可持续发展目标的接近度矩阵和中心性度量的结果是通用的,并创建了基本的可持续发展目标网络,但由于各国在网络的不同部分取得…

前端网格布局grid

网格布局 <style> .container {border:none;display: grid;height: 600px;grid-template-columns: 200px 1fr; /*两列&#xff0c;第一列200px&#xff0c;第二列自适应*/grid-template-rows: 50px 1fr 30px; /*三行&#xff1a;第一行&#xff1a;50px,第二行&#…

【C语言每日一题】——猜名次

【C语言每日一题】——猜名次&#x1f60e;前言&#x1f64c;猜名次&#x1f64c;解题思路分享&#xff1a;&#x1f60d;解题源码分享&#xff1a;&#x1f60d;总结撒花&#x1f49e;&#x1f60e;博客昵称&#xff1a;博客小梦 &#x1f60a;最喜欢的座右铭&#xff1a;全神…

大数据之-Nifi-应用场景2-2_设置putfile处理器自动创建目标文件夹_以及存在重复文件时自动覆盖---大数据之Nifi工作笔记0006

上一节我们留了两个问题,一个是,如果我们没有创建putfile要写入的目标文件夹,会报错吗? 可以看到我们putfile目标文件夹是上面这个目录 我们来试一试,如果目标文件夹不存在,putfile处理器会自动创建吗 首先我们删除这个target目标文件夹 然后我们进入cd source目录,源文件夹目…

echart在微信小程序的使用

echart在微信小程序的使用 echarts不显示在微信小程序 <!-- 微信小程序的echart的使用 --> <view class"container"><ec-canvas id"mychart-dom-bar" canvas-id"mychart-bar" ec"{{ ec }}"></ec-canvas> &l…

SVNH数据(.mat格式)转为图像(.png)matlab代码

一、获取SVNH数据数据集集地址-http://ufldl.stanford.edu/housenumbers/提供两种格式的数据&#xff1a;1.Format 1&#xff0c;图像形式&#xff0c;压缩包2.Format 2&#xff0c; .mat格式的数据10 classes, 1 for each digit. Digit 1 has label 1, 9 has label 9 and 0 ha…

Git在日常使用过程中的常用命令

文章目录Git在日常使用过程中的常用命令写在前面1. 创建本地仓库2. 将本地文件添加到暂存区3. 将本地文件从暂存区撤销4. 将修改提交到本地仓库5. clone远程版本库到本地。6. 为本地版本库添加一个远程仓库7. 推送到远程仓库8. 将远程分支内容拉取到本地Git在日常使用过程中的常…

Docker下快速搭建RabbitMQ单例及集群

引子生命在于折腾&#xff0c;为上数据实时化用到了消息传送的内容&#xff0c;当时也和总公司人员商量选型&#xff0c;kafka不能区分分公司就暂定用了RbtMQ刚好个人也在研究容器及分布式部署相关内容就在docker上实践单机 docker&#xff08;要想快 先看问题 避免踩坑&#x…

Linux 简介

Linux 内核最初只是由芬兰人林纳斯托瓦兹&#xff08;Linus Torvalds&#xff09;在赫尔辛基大学上学时出于个人爱好而编写的。 Linux 是一套免费使用和自由传播的类 Unix 操作系统&#xff0c;是一个基于 POSIX 和 UNIX 的多用户、多任务、支持多线程和多 CPU 的操作系统。 …

[安装]ThinkPad X250加装固态硬盘教程

方案&#xff1a;保留原有的机械硬盘&#xff0c;再加装一个固态硬盘作为系统盘。由于X250没有光驱&#xff0c;这样就无法使用第二个2.5寸的硬盘。还好&#xff0c;X250留有一个M.2接口&#xff0c;这样&#xff0c;就可以使用NGFF M.2接口的固态硬盘。不过&#xff0c;这种接…

如何在 Python 中验证用户输入

要验证用户输入&#xff1a; 使用 while 循环进行迭代&#xff0c;直到提供的输入值有效。检查输入值在每次迭代中是否有效。如果该值有效&#xff0c;则跳出 while 循环。 # ✅ 验证用户输入的是否是整数num 0while True:try:num int(input("Enter an integer 1-10: …

python练习

项目场景一&#xff1a; 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢&#xff1f; 问题描述 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶…

一文讲明TCP网络编程、Socket套接字的讲解使用、网络编程案例

文章目录1 Socket讲解2 基于Socket的TCP编程3 客户端Socket的工作过程包含以下四个基本的步骤3.1 客户端创建Socket对象4 服务器程序的工作过程包含以下四个基本的步骤&#xff1a;4.1 服务器建立ServerSocket对象5 案例实现 客户端和服务端通信5.1 代码实现5.2 实现结果6 更多…

cgroup基础介绍

一项新概念的产生&#xff0c;必然有其原因&#xff0c;cgroup也不例外&#xff0c;最初由谷歌工程师Paul Menage和Rohit Seth提出【1】&#xff1a;因为计算机硬件能力越来越强大&#xff0c;为了提高机器的使用效率&#xff0c;可以在同一台机器上运行不同运算模型的工作。开…

安卓---第5章 数据存储---保存QQ账号与密码

文章目录案例1: 使用文件存储 保存QQ账号与密码功能描述saveqq_1.xmlFileSaveQQ.javasaveqq_1案例2 使用SP保存QQ账号与密码功能描述SPSaveQQ.java其他代码1. 数据存储方式2. 文件存储将数据存入文件中内部存储&#xff1a;外部存储&#xff1a;从文件中读取数据读取内部存储读…

信息系统服务管理

一、信息系统服务业及发展二、信息系统工程监理的概念及发展三、信息系统运行维护的概念和发展 IT服务管理&#xff08;ITSM) 四、信息技术服务管理的标准和框架 IT服务标准体系&#xff08;ITSS&#xff09; 一、信息系统服务业及发展 总结&#xff1a;前景很好 二、信息系…

计网传输层协议:UDP和TCP

文章目录一. 应用层和传输层的联系二. UDP协议三. TCP协议1. TCP报头介绍2. TCP实现可靠传输的核心机制2.1 确认应答2.2 超时重传3. 连接管理(三次握手, 四次挥手)3.1 建立连接(三次握手)3.2 断开连接(四次挥手)4. 滑动窗口5. 流量控制6.拥塞控制7. 延时应答8. 捎带应答9. 面向…

5.InfluxDB定时任务与报警

定时任务 InfluxDB的定时任务本质上是定时执行一个Flux脚本,一般回先查询数据再聚合修改最后可以写回另外一个bucket中 常用的定时任务使用场景 降采样 : 如果数据的输入频率特别快比如IOT温度计设备每秒往InfluxDB写入一条数据会有大量的数据写入一个InfluxDB的bucket (因为…