一夜爆火的现象级产品ChatGPT,是AI突破还是昙花乍现?

news2024/12/28 20:38:24
导语 | 编写代码、翻译小说、参加考试……2022 年末,人工智能聊天机器人 ChatGPT 风靡全网。自 2016 年 AlphaGo 击败围棋世界冠军李世石后,ChatGPT 再次掀起了人工智能发展应用的高潮。它将会给我们带来哪些影响?人工智能的颠覆性应用是否即将来?ChatGPT 的未来发展潜力及前景如何?我们特邀腾讯云 TVP、PreAngel 合伙人 李卓桓老师,以 ChaBot 领域专家视角,分享他对ChatGPT 发展的独到见解。

作者简介

李卓桓,腾讯云 TVP,PreAngel 合伙人,专注人工智能领域的聊天对话创业机会和早期项目。zixia BBS、优酷网(首席科学家)、叽歪网创始人,水木清华 BBS 站长。清华大学本科,中欧国际工商学院 EMBA。15 年互联网创业经验,多家创业公司和 VC 机构顾问。创业邦、创业家、新浪网等媒体都对他作过创业特别报道。25 年编程经验,曾任 ChinaRen 系统工程师。Microsoft Regional Director,Google 认证机器学习开发者专家(ML GDE, Machine Learning Google Developer Expert)。活跃在 Open Source 社区,创立发布的 Chatbot SDK 开源项目 Wechaty 已在 GitHub 上拥有近万 Stars 数。荣获 2020 年中国优秀开源项目,中国开源先锋等奖项。《Chatbot 从 0 到 1》、《简明的 TensorFlow 2》联合作者。

其它两位联合作者:

Siky Lin,毕业于斯坦福大学数据传媒系,曾就职于硅谷多家著名风投机构与独角兽,现任硅谷独角兽 Moveworks 市场战略高级经理;

ChatGPT by OpenAI: 以下全文由 ChatGPT 辅助撰写。

一、ChatGPT:人工智能技术的重大突破

随着近来 ChatGPT 的爆红,很多程序员都争先恐后去领略它的超高情商和巨大威力,而 ChatGPT 输出的答案或偶尔幽默,或时而深刻,我们甚至很难分清与它对话的究竟是人还是机器。

实际上,人工智能(AI)在过去几年承载了许多希望与失望。一开始很多人认为 AI 可以如电影所设想那样在不远的将来改变世界,甚至比人类更强从而统治主宰人类世界。然而在过去几年我们发现,现有科技能开发出来的 AI 只能替代人类从事一些最基础的生产活动,仅仅停留于一个三岁婴儿般的智力。而开发这样一个“人工智障”,我们需要花费大量的资本支持来突破极限的算力跟最顶级的科学家做最前沿的研究。这与之换来的结果却是投资人寄予厚望的高估值科技公司在过去几年并未能开发出大家期待的 AI 产品。

其实,推出 ChatGPT 的是硅谷一家于 2015 年初创的公司 OpenAI,它在成立后便默默研发其人工智能技术。虽然公司花费了大量投资人的资金,同时也聚集了最顶级的科学家研发,然而外界对 OpenAI 的研发进展却始终所知甚少。

然而,就在两个月前,OpenAI 推出了接近通用人工智能的产品 ChatGPT,这是一款基于聊天界面的 Chatbot,在 2022 年 12 月 2 日开放免费试用网页版后,上线短短 5 天,用户数量已突破百万。这款产品的试用结果铺天盖地,且在社交媒体上大受欢迎,各种技术大牛和行业领军人物纷纷分享他们的使用体验。

(图1,一个 ChatGPT 为博客起标题的例子)

ChatGPT 的推出无疑标志着人工智能技术的重大突破,OpenAI 的研发团队在经过多年的不懈努力和研究之后终于成功打造出一款具有高度自然语言处理能力的人工智能产品。这款产品具有非常高的自然语言理解和生成能力,可以帮助用户在日常对话中进行有效沟通。并且,这款产品还具有非常强大的学习能力,能够不断地学习和改进自己的知识体系。

在 OpenAI 发布这款产品后,人们除了对此感到震惊、兴奋外,甚至还有些恐慌。原因在于这款产品作为人工智能技术领域中罕见的突破之一,它不仅让我们看到了人工智能未来发展的曙光,也让我们窥探到了人类未来在人工智能驱动下将如何发展。ChatGPT 的推出不仅为 OpenAI 公司带来了巨大成功,也为人工智能行业的发展铺平了道路。

二、风靡全网的ChatGPT为何一夜走红?

ChatGPT 是 OpenAI 公司开发的自然语言处理模型,它是 GPT(Generative Pre-trained Transformer)系列的最新版本,具有强大的语言理解能力和自然语言生成能力。

过去两个月时间里,ChatGPT 在科技领域引起巨大的反响的原因,主要在于它具有以下三个显著特点:

  • 数据量庞大:ChatGPT 模型训练使用主要来自互联网的文本数据库,包括从书籍、网络文本、维基百科、文章和互联网上的其他文章中获得高达 570GB 的数据。 更准确地说,系统输入了 3000 亿个单词,这使得它能够更好地理解和生成人类语言。
  • 预训练技术:ChatGPT 模型采用了预训练技术,能够在训练过程中学习大量的语言知识和经验,使得它在解决实际问题时更加准确和高效。
  • 多任务能力强:ChatGPT 模型能够完成多种自然语言处理任务,如文本生成、问答、机器翻译等,其中,它在文本生成的任务上表现最为突出。

值得一提的是,ChatGPT 还开放了免费无门槛试用,任何用户都可以直接体验它的威力并分享试用体验。这相当于,OpenAI 每天都要燃烧超过三百万美金的经费以供大家试用。当然,我们看到的结果也是十分惊人的,它既可以吟诗作赋写广告,又可以根据你提的需求写代码。ChatGPT 展现的语言理解和生成能力,丝毫不亚于任何行业初级人员对专业领域的基础输出。过去,或许只有专业的 AI 研究人员才能体会其进展,但在现在,我们每一个人都能亲自体验。

其实在 ChatGPT 问世之前,美国不少科技初创公司就已经在使用 GPT 模型,成为 OpenAI 的付费用户。在此基础上,OpenAI 巧妙地加了一层可以聊天问答的界面让大家可以方便简易地使用,从而命名为 ChatGPT。GPT 作为一种学习训练了大量数据的基础模型,主要可以为以下几个场景赋能:

  • 文本生成:如自动生成新闻报道、自动摘要等,可以有效帮助提高文本内容的生成效率。
  • 自动问答:如智能问答系统、聊天机器人等,可以帮助公司提高客户服务质量跟速度。
  • 自动写作:如文案创作、文章摘要、邮件自动回复等,可以帮助用户提高内容创作效率。

Jasper.ai 便是 ChatGPT 的场景应用典型代表,估值 15 亿美金的新晋独角兽 Jasper.ai 直接应用了 GPT 模型,并开发了市场营销的大量应用场景,可以让用户用它直接撰写广告标语、博客、社交媒体帖子和电子邮件等。这让市场营销的人员有了一个可以帮他们干活写作的小助手,ChatGPT 的基础版本为每月 40 美金,比雇佣一个实习生还便宜很多。Jasper.ai 目前已经有了超过 10 万付费用户,并且在 2022 年实现了超过 100% 的增长。其实,Jasper 的创始人 Dave Rogenmoser 就出身于市场营销领域,他并不是专攻人工智能开发的专家,但仍可以借力 ChatGPT 来实现成功。同时,Jasper 也需要面临许多竞争对手的同质化问题,如Copy.ai,WriteSonic, Peppertype, Wordtune,Simplified 等这些创初公司,它们也都在逐渐推出类似的产品。

(图2,Jasper.ai 的产品覆盖简介)

我们相信在未来几年,将会有大量基于 GPT 模型的初创公司涌现。因为 GPT 的提升让许多公司可以极大地减少自己开发人工智能的底层模型成本,从而可以集中人力物力研究商业应用场景,使产品的推出与迭代更新得更为迅猛。

而 ChatGPT 的出现,毋庸置疑更是把 GPT 模型具象化了,它能够让各行业人士直接体会到它的魅力。例如,它可以让很多不是专业的 AI 开发人员,但对特定垂直领域有深入洞见的人,可以跳过长期艰难的技术开发,通过直接套用 GPT 模型,结合其它如软件自动化的技术,迅速推出适应于各垂直领域的智能小助手。这就像当年乔布斯推出了苹果智能手机,虽然引发了科技圈的震动,但短时间内大家并不知道这意味着什么。直到又过了几年,我们看到了传统手机厂商如诺基亚怦然倒下,同时也带来了轰轰烈烈的移动互联网时代,大量基于手机应用的初创公司如雨后春笋般涌出,彻底改变了我们的衣食住行。现在的我们难以想象,如果没有智能手机的普及,我们出行无法打车、用餐不能点外卖,购物也难以进行电子支付将会是怎样的生活。

同时,也有不少人开始质疑 ChatGPT 的推出是否会导致大量已有的 Chatbot 公司消亡。然而,现状却是 ChatGPT 把大量现有的 Chatbot 公司带火了。专注做 Chatbot 的科技公司纷纷宣称,ChatGPT 将加快他们的研发进程,不仅不会让他们消亡,反而会让他们更快地迭代产品,更好地服务客户。

三、未来GPT模型时代下,科技公司谁与争锋?

实际上,OpenAI 创始人 Sam Altman 曾在某采访中暗示, “中间层”(middle-layer) 的初创公司将会在未来脱颖而出。

假设存在底层和顶层类别的公司,首先,他认为,“底层”(bottom-layer)试图从零开始构建自己的 LLM (Large Language Model)的公司不太可能成功。因为建造这些模型的成本太高并且没有必要,这些模型已经可以直接获得。在当今世界中,这类似于在 AWS 和 Azure 已经存在的情况下建造自己的数据中心。其次,顶层(top-layer)这一类公司将是短暂存在的 API 调用者,称之为顶层公司。这些公司直接使用现成的 GPT 模型进行应用。简单的直接调用其模型 ,没有其他技术壁垒或者创造超级价值给消费者,这些公司将会有短暂崛起,但终将消亡。除非这些公司能够找到成为中间层公司的方法。

那么,“中间层” 公司是什么,成为它需要什么?在我看来,中间层公司有几个关键成分:

  • 独特的垂直领域知识或者数据。
  • 强大的机器学习基础设施。
  • 垂直领域相关的专业人才。

这种公司将能够采用 GPT 类模型,并提高这些模型在其垂直领域的性能,比如说在医学领域跟计算机编程领域。在不久的将来,这些中间层公司的应用将看到由 GPT 驱动的独特高度差异化的用例。使用 GPT 作为基础模型,并使用专有训练数据或者垂直领域洞见创建新模型,这将是非常强大的。微调模型并不简单。硅谷致力于用 Chatbot 解决企业 IT 问题的独角兽Moveworks 创始人表示,他们已经采用 LLM 并微调它们多年,需要在人员和基础设施上进行数年的重大研发投资才能实现。

(图3,Moveworks 发布的其训练模型演变路径)

ChatGPT 虽然看起来好像上通天文下知地理,但在特定领域,它仍然还是个小孩,特别是与专业商业场景结合和缺少公开网络数据的领域,它容易一本正经胡说八道。自从开放免费测试版以来,大家讨论最多的问题就是 ChatGPT 是否会成为让谷歌过时的智能问答机器人,就像谷歌在过去 10 年颠覆了当年如日中天的雅虎一样,也许谷歌在不久的将来也会被 ChatGPT 颠覆。

与谷歌不同,ChatGPT 不会在网络上抓取时事信息,它的知识仅限于其语言模型在 2021 年之前学到的东西。如果你问 ChatGPT 任何关于未来的预测或者实时信息,它是无法解答的。例如,你问它美国加州最好的餐厅是什么,因为这个答案是会根据时间的变化而改变,所以 ChatGPT 会告诉你它无法回答。OpenAI 也公开承认指出当 LLM 用于特定商业场景的时,比如在商业环境中回答员工 IT 问题或在医疗环境中提供自动化的患者支持时,由于其模型只学过公开数据中的片面知识,很可能会给出一个错误或者片面的答案。

不过,OpenAI 才刚刚给世人展示它多年炼丹的成果。GPT-4,OpenAI 公司大型语言模型的下一个版本很可能会在 2023 年推出。根据《连线》杂志的消息,GPT-4 将拥有 100 万亿个参数,而 ChatGPT 目前训练的参数为 1750 亿个。从这个数字来看,GPT-4 的参数数量约为GPT-3 的五百倍。众所周知,参数数量越多,模型就能够学习到更多的知识和模式,从而提高它的性能,这也意味着 GPT-4 将拥有更强大的学习能力,并能够处理更复杂的任务。

AI 从量变达到质变的时刻正在步步逼近,大量基于 Conversational AI 的应用场景将会在未来五年出现井喷,让我们拭目以待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/194496.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MyBatis 二级缓存整合Redis【学习记录】

二级缓存整合Redis 上篇文章介绍了MyBatis自带的二级缓存,但是这个缓存是单服务器工作,无法实现分布式缓存。那么什么是分布式缓存呢?假设现在有两个服务器1和2,用户访问的时候访问了服务器1,查询后的缓存就会放在服务…

酒店预订订单的分析与建模【决策树、xgboost】

酒店预订订单的分析与建模【决策树、xgboost】 本项目包含 1.数据处理 2.数据探索性分析 3.网格搜索对决策树、xgboost进行模型参数调优 4.基于五折交叉验证的决策树、xgboost模型预测 专栏和往期项目 👉往期文章可以关注我的专栏 下巴同学的数据加油小站 会不…

《神经网络与深度学习》 邱希鹏 学习笔记(二)

正则化 所有损害优化的方法都是正则化。增加优化约束,干扰优化过程 优化约束包括 L1/L2约束,数据增强 干扰优化包括 随机梯度下降 权重衰减 提前停止 在上式中 y(n)为样本n,其展开形式为y^{(n)}为样本n,其展开形式为y(n)为样本…

【Axure教程】低代码可视化编辑器

低代码是一组数字技术工具平台,基于图形化拖拽、参数化配置等更为高效的方式,通过少量代码或不用代码实现数字化转型中的场景应用创新。例如在业务系统中,如果企业新增了一项业务,以往往往需要对系统继续开发和升级,但…

【Python学习笔记】9. Python3 解释器

前言 Linux/Unix的系统上,一般默认的 python 版本为 2.x,我们可以将 python3.x 安装在 /usr/local/python3 目录中。 Python3 解释器 Linux/Unix的系统上,一般默认的 python 版本为 2.x,我们可以将 python3.x 安装在 /usr/loca…

IDEA 常用插件跟配置提升开发效率

工欲善其事必先利其器 安装好 IntelliJ IDEA 后,进行如下的初始化操作,工作效率提升50倍。 一、插件 1. Codota 代码智能提示插件 只要打出首字母就能联想出一整条语句,这也太智能了,还显示了每条语句使用频率。原因是它学习了…

最全的视频转换器工具清单,这18款免费视频格式转换器记得收藏

审查和比较具有功能和定价的最佳视频转换器软件。从这个顶级付费和免费在线视频转换器工具列表中选择,以快速轻松地转换任何视频: 什么是视频转换器? 视频转换工具允许您将视频从一种格式转换为另一种格式。第一个商业上成功的视频格式是 Q…

11.1-股票基金历年收益率计算

文章目录1. 计算目标2. 关键问题3. 获取交易日历4. 逻辑编写1. 计算目标 我们想知道,一只股票标的,在之前的几年中,每一年的年化收益率是多少? 如果将每年的年化收益率进行求和汇总,截止到今年,总共年化收…

五、Mybatis详细教程

Mybatis概述 1 Mybatis概念 MyBatis 是一款优秀的持久层框架,用于简化 JDBC 开发 MyBatis 本是 Apache 的一个开源项目iBatis, 2010年这个项目由apache software foundation 迁移到了google code,并且改名为MyBatis 。2013年11月迁移到Github 官网&am…

Qt OpenGL(三十五)——Qt OpenGL 核心模式-点云(斯坦福兔子)

提示:本系列文章的索引目录在下面文章的链接里(点击下面可以跳转查看): Qt OpenGL 核心模式版本文章目录 Qt OpenGL(三十五)——Qt OpenGL 核心模式-点云(斯坦福兔子) 一、场景 我们在平时的项目中,有的时候会遇到,激光雷达等这些设置采集的数据集,不管是在机器人、…

【微服务】分布式缓存Redis

分布式缓存Redis基于Redis集群解决单机Redis存在的问题1.Redis持久化1.1.RDB持久化1.1.1.执行时机1.1.2.RDB原理1.1.3.小结1.2.AOF持久化1.2.1.AOF原理1.2.2.AOF配置1.2.3.AOF文件重写1.3.RDB与AOF对比2.Redis主从2.1.搭建主从架构2.2.主从数据同步原理2.2.1.全量同步2.2.2.增量…

UVM实战(张强)--- UART实例代码详细注解

目录一、整体的设计结构图二、各个组件代码详解2.1 DUT2.2 my_driver2.3 my_transaction2.4 my_env2.5 my_monitor2.6 my_agent2.7 my_model2.8 my_scoreboard2.9 my_sequencer2.10 base_test2.11 my_case02.12 my_case1一、整体的设计结构图 各个模块的基础介绍: &…

Spring核心——面向切面编程(AOP)

Spring核心——AOP(Aspect-oriented programming)一、概念二、作用三、AOP核心概念1.连接点(JoinPoint)2.切入点(Pointcut)3.通知(Advice)4.通知类5.切面(Aspect&#xf…

c语言 结构体 动态内存 动态内存管理 模拟实现atoi 找单身狗 文件操作程序编译和链接 预处理 交换奇偶位 offsetof宏的实现 习题

结构体大小 【题目名称】 在32位系统环境,编译选项为4字节对齐,那么sizeof(A)和sizeof(B)是( C ) 对齐数是取其较小值 struct A {int a;short b;int c;char d; }; struct B {int a;short b;char c;int d; };【题目内容】 A. 1…

小程序项目学习--第五章:项目实战一

第五章:项目实战一、 01_(了解)音乐小程序的项目介绍 坑关于Vant Weapp中组件引入未找到的解决方案 [ pages/main-music/main-music.json 文件内容错误] pages/main-music/main-music.json: [“usingComponents”][“van-search”]: “vant/weapp/search/index”…

阿里云们扎堆集结,数据库黄金时代到了?

配图来自Canva可画 作为全球数一数二的信息产业大国,我国在信息技术软硬件底层标准、架构、产品以及生态体系方面,长期被外商“卡脖子”,其中数据库市场更是长期被甲骨文等外商公司所占据。 近年来伴随着信创产业的高速发展,国内…

第七章 idea集成git本地库操作

第一节 配置忽略文件 1、哪些文件需要忽略? 对于git来说可以忽略的文件 Eclipse工程特定文件 IDEA工IDEA工程特定文件 编译产生的二进制文件(对于Maven工程来说就是target目录) 2、为什么要忽略这些文件? 与项目的实际功能无…

巧用Golang泛型,简化代码编写

作者 | 百度小程序团队 导读 本文整理了很多的泛型应用技巧,结合具体的实际代码示例,特别是很多直接对Go语言内置的类库的实现进行改造,再通过两者在使用上直观对比,帮助大家对泛型使用思考上提供了更多思路,定会帮助大…

【教程】Python:IDLE开发环境安装与配置保姆级教学

【教程】Python:IDLE开发环境安装与配置保姆级教学下载地址安装步骤编写你的Python程序IDLE交互界面(交互式运行)IDLE编辑器(文件式运行)下载地址 请访问官网:python解释器安装 安装步骤 若安装最新版本…

FPGA的ADC信号采集ADS52J90-JESD204B接口

jesd204b实战操作笔记 本篇的内容是基于博主设计的jesd204b接口的ADC和FPGA的硬件板卡,通过调用jesd204b ip核来一步步在FPGA内部实现高速ADC数据采集,jesd204b协议和xilinx 的jesd204 IP核相关基本知识已在前面多篇文章中详细介绍,这里不再…