文 | 天于刀刀
当我们在抱怨搜索引擎的时候我们具体在说些什么?
也许是饱受诟病的广告?或者是不合理的网页排序?又或是一种最直观的感觉——不好使。
但是从来没有人抱怨过搜索引擎这一个模式。
尽管这些年,也诞生一些诸如Magi这样让人眼前一亮的新型搜索产品,试图颠覆旧的搜索形式,但无一例外宣告失败。
直到这几天,一个重磅看似与搜索无关的AI模型的诞生,却大有撼动谷歌搜索地位的趋势...
这是一个在Twitter上特别火的帖子,目前已获得3千多次转推:
Google is done. 谷歌时代结束了。
这条Twitter的博主搜索了一些它日常请教谷歌的问题(query),却发现OpenAI刚刚发布的“AI对话模型ChatGPT”的回答,完爆了谷歌搜索结果。。。
博主问谷歌的问题是:
In Latex, how do I represent a different equation?
(在Latex中,如何书写微分方程)
谷歌给出的搜索结果:
尽管谷歌给出的结果也看起来很智能了,搜索首位直接贴出来了回答。
但我们再看一下ChatGPT的回答:
真的是没有对比,就没有伤害哇!
在没见过ChatGPT的回复的情况下,笔者已经觉得谷歌的回答够好了。但看了ChatGPT的回答,立刻感受到了“优秀学生”与“年级第一”的区别。
这条推特的博主,还贴出了大量的搜索问题,发现相当多的问题,谷歌搜索被ChatGPT完爆了。
感兴趣的小伙伴可以去看原推,非常精彩:
https://twitter.com/jdjkelly/status/1598021488795586561
这里就不一一搬运了。
看完后,笔者只能感叹,谷歌、百度这些老牌搜索引擎,这次可能真的“摊上事儿”了。
接下来,我们再简单看一眼这个ChatGPT模型的官方定义:
根据其官网上的介绍,目前它们推出的 ChatGPT 支持和用户通过对话的形式“回答问题”,并且赋予了一些简单的智能化行为,例如“承认自己的不足、识别一些错误的假设和拒绝一些不合理的请求”。
ChatGPT模型Demo测试地址:
https://chat.openai.com/chat
推特用户@jdjkelly的推文 [1] 还表示,它发现对于代码开发类的搜索query,ChatGPT的回答强势的完爆了谷歌——ChatGPT除了给出了代码方案外,他还非常详细地给出了相应的解释!
该用户测试的搜索query是:
How do I mark a solidity function as callable only by the contract creator?
(如何将solidity函数标记为只能由合同创建者调用?)
谷歌的回答:
ChatGPT的回答:
不仅贴代码,还附带解释真是太秀了。。。
对比搜索步骤,ChatGPT 为我们节省了大量的(无效)阅读时间和检索时间!其生成的解释性文字也十分地清晰和易读,能够很好地帮助回答客户的疑问。
最重要的是,它可以直接生成可供复制的代码诶!(打工人泪目)
目前该项目链接已经被免费开放 [2],不少外网开发者在试用中声称 ChatGPT 针对他们的技术问题提供了非常详细的解决方案。此外还在多个领域的知识问答和闲聊场景下,ChatGPT 同样表现出了不俗的智能。
笔者忍不住做了进一步的测试:
首先第一条测试数据,咱们中国人给 ChatGPT 直接上点难度,用中文进行输入,让它先介绍一下自己:
嗯。。。中规中矩的结果,看不出来什么太多情况。唯一能够得到的结论是 ChatGPT 支持中文输入,这个对于中文开发人员和研究者来说可以说是一个好消息。
那么我们再尝试将他和其他搜索引擎相比呢?
学术软件使用问题:
谷歌:在LaTex中,我应该如何输入一个偏微分方程?
ChatGPT :在LaTex中,我应该如何输入一个偏微分方程?
产品推荐问题:
谷歌:Say I have 1000 dollars, recommend me a pinarello bike (假如我有一千美元,请推荐一款 pinarello 的自行车)
ChatGPT:Say I have 1000 dollars, recommend me a pinarello bike (假如我有一千美元,请推荐一款 pinarello 的自行车)
闲聊问题:
ChatGPT:我最近肚子不舒服,有什么药能推荐一下吗
ChatGPT:你知道夕小瑶的卖萌屋吗?
知识问答问题:
ChatGPT:什么是世界杯?
ChatGPT:自行车蹭碟后怎么维修?
可以看到 ChatGPT 在一些问题中普遍表现出了远超预期的效果,对于问题的回复和解答基本上还是有意义的。
对于一些存在隐私限制的搜索结果,ChatGPT 也会很谨慎地表示自己只是一个机器,我们更应该遵循专业人士的建议。
在和 ChatGPT 进行交互的过程中,笔者感觉与其说是自己主动地在寻找信息,不如说是在和一个“智慧长老”进行互动:它会针对你的问题进行合理地回答,只要它知道。
这个特点让笔者想起了“第五范式:数据工程”的 reStructured Pre-training [3] 。
这篇文章的作者将预训练大模型类比为人脑和传统的数据库,都是数据储存的一个媒介。而在进行数据检索的时候,人脑依靠的是思考,数据库依靠的是 SQL 语言,而预训练大模型则依靠的是 prompt。
短短2个月前学界还在质疑 prompt 是否能够完全达到“所查即所得”的效果,也就是说,下游任务并不知道使用何种 prompt 可以更好地从大模型中获取想要的结果。
1个月前,在大众层面人们们逐渐习惯了 AI 绘画的“关键字” prompt 概念,开始绞尽脑汁想着自己独特的“魔法咒语”。
而在 2022 年的最后一个月,我们突然发现也许不用多么复杂的“咒语”也能呼唤出我们真正想要的信息结果。
NLP 技术的快速爆发让所有人都猝不及防,也许在不知不觉间中一个全新的时代已经来临。
目前 ChatGPT 没有通过互联网检索信息的能力,因此在一些边界问题上略显无知。此外 ChatGPT 可能因为语料缺失的原因导致了它对于中文语料的陌生。
(关二爷:俺是俺儿子?!?)
卖萌屋作者:天于刀刀
注重 WLB 的工业界反卷斗士,未进化的 NLP 咸鱼一条。专注于研究在各个场景中算法模型的落地情况,希望自己编写的算法有朝一日可以改变世界。目前的兴趣点在于:假新闻检测、深度学习模型可解释性等。
作品推荐
1.腾讯薪酬改革来了!晋升≠加薪?员工到底为何工作?
2.从 Google AI 离职了,这里让我爱不起来
3.百万悬赏!寻找“模型越大,效果越差”的奇葩任务!
4.想通这点,治好 AI 打工人的精神内耗
后台回复关键词【入群】
加入卖萌屋NLP、CV、搜广推与求职讨论群
[1]https://twitter.com/jdjkelly/status/1598021488795586561
[2]https://chat.openai.com/chat
[3]reStructured Pre-training, https://arxiv.org/abs/2206.11147