谷歌要完,百度也危了

news2024/9/20 13:37:03

5e30b8f97d4f901b75e0d49295058f7a.jpeg

文 | 天于刀刀

当我们在抱怨搜索引擎的时候我们具体在说些什么?

也许是饱受诟病的广告?或者是不合理的网页排序?又或是一种最直观的感觉——不好使。

但是从来没有人抱怨过搜索引擎这一个模式。

尽管这些年,也诞生一些诸如Magi这样让人眼前一亮的新型搜索产品,试图颠覆旧的搜索形式,但无一例外宣告失败。

直到这几天,一个重磅看似与搜索无关的AI模型的诞生,却大有撼动谷歌搜索地位的趋势...

这是一个在Twitter上特别火的帖子,目前已获得3千多次转推:

fa60e49f0d7f45bb15cfebd0a1a4a2c2.png

Google is done. 谷歌时代结束了。

这条Twitter的博主搜索了一些它日常请教谷歌的问题(query),却发现OpenAI刚刚发布的“AI对话模型ChatGPT”的回答,完爆了谷歌搜索结果。。。

博主问谷歌的问题是:

In Latex, how do I represent a different equation?
(在Latex中,如何书写微分方程)

谷歌给出的搜索结果:

9ae7ae50610dce443fc06de1024d9539.png

尽管谷歌给出的结果也看起来很智能了,搜索首位直接贴出来了回答。

但我们再看一下ChatGPT的回答:

d2de73708ff55c29126920dd24f36016.png

真的是没有对比,就没有伤害哇!

在没见过ChatGPT的回复的情况下,笔者已经觉得谷歌的回答够好了。但看了ChatGPT的回答,立刻感受到了“优秀学生”与“年级第一”的区别。

这条推特的博主,还贴出了大量的搜索问题,发现相当多的问题,谷歌搜索被ChatGPT完爆了。

感兴趣的小伙伴可以去看原推,非常精彩:

https://twitter.com/jdjkelly/status/1598021488795586561

这里就不一一搬运了。

看完后,笔者只能感叹,谷歌、百度这些老牌搜索引擎,这次可能真的“摊上事儿”了。

接下来,我们再简单看一眼这个ChatGPT模型的官方定义:

c3b66e78c7f5365e67a8e48a697426e9.jpeg

根据其官网上的介绍,目前它们推出的 ChatGPT 支持和用户通过对话的形式“回答问题”,并且赋予了一些简单的智能化行为,例如“承认自己的不足、识别一些错误的假设和拒绝一些不合理的请求”。

ChatGPT模型Demo测试地址:

https://chat.openai.com/chat

推特用户@jdjkelly的推文 [1] 还表示,它发现对于代码开发类的搜索query,ChatGPT的回答强势的完爆了谷歌——ChatGPT除了给出了代码方案外,他还非常详细地给出了相应的解释!

该用户测试的搜索query是:

How do I mark a solidity function as callable only by the contract creator?
(如何将solidity函数标记为只能由合同创建者调用?)

谷歌的回答:

d0f3b8635244869d2c3394f29378c69e.png

ChatGPT的回答:

ca7326e7c5201a9b712f900f5a4e993c.png

不仅贴代码,还附带解释真是太秀了。。。

对比搜索步骤,ChatGPT 为我们节省了大量的(无效)阅读时间和检索时间!其生成的解释性文字也十分地清晰和易读,能够很好地帮助回答客户的疑问。

最重要的是,它可以直接生成可供复制的代码诶!(打工人泪目)

目前该项目链接已经被免费开放 [2],不少外网开发者在试用中声称 ChatGPT 针对他们的技术问题提供了非常详细的解决方案。此外还在多个领域的知识问答和闲聊场景下,ChatGPT 同样表现出了不俗的智能。

笔者忍不住做了进一步的测试:

首先第一条测试数据,咱们中国人给 ChatGPT 直接上点难度,用中文进行输入,让它先介绍一下自己:

c7e51055b80312093b0e86b372124253.jpeg

嗯。。。中规中矩的结果,看不出来什么太多情况。唯一能够得到的结论是 ChatGPT 支持中文输入,这个对于中文开发人员和研究者来说可以说是一个好消息。

那么我们再尝试将他和其他搜索引擎相比呢?

学术软件使用问题:

谷歌:在LaTex中,我应该如何输入一个偏微分方程?678c605b8ca2deb5c232dd5fec201acf.jpeg

ChatGPT :在LaTex中,我应该如何输入一个偏微分方程?4aa74f75984ab657d46116ffa1d16357.jpeg

产品推荐问题:

谷歌:Say I have 1000 dollars, recommend me a pinarello bike (假如我有一千美元,请推荐一款 pinarello 的自行车)53faf263e922522d306aa16fe2f0d582.jpeg

ChatGPT:Say I have 1000 dollars, recommend me a pinarello bike (假如我有一千美元,请推荐一款 pinarello 的自行车)68c10d0d31a477d7291b77dbf380f601.png

闲聊问题:

ChatGPT:我最近肚子不舒服,有什么药能推荐一下吗a0b19dc7b98ba926ee0d66dc343fc845.png

ChatGPT:你知道夕小瑶的卖萌屋吗?4b0d96a658efb8add14c41197827ee02.jpeg

知识问答问题:

ChatGPT:什么是世界杯?6d48ae89efaa32fe6af47d8adfa4a87f.jpeg

ChatGPT:自行车蹭碟后怎么维修?d5c6566726849cf9cd19c1730ea163af.jpeg

可以看到 ChatGPT 在一些问题中普遍表现出了远超预期的效果,对于问题的回复和解答基本上还是有意义的。

对于一些存在隐私限制的搜索结果,ChatGPT 也会很谨慎地表示自己只是一个机器,我们更应该遵循专业人士的建议。

在和 ChatGPT 进行交互的过程中,笔者感觉与其说是自己主动地在寻找信息,不如说是在和一个“智慧长老”进行互动:它会针对你的问题进行合理地回答,只要它知道。

这个特点让笔者想起了“第五范式:数据工程”的 reStructured Pre-training [3] 。

这篇文章的作者将预训练大模型类比为人脑和传统的数据库,都是数据储存的一个媒介。而在进行数据检索的时候,人脑依靠的是思考,数据库依靠的是 SQL 语言,而预训练大模型则依靠的是 prompt。

短短2个月前学界还在质疑 prompt 是否能够完全达到“所查即所得”的效果,也就是说,下游任务并不知道使用何种 prompt 可以更好地从大模型中获取想要的结果。

1个月前,在大众层面人们们逐渐习惯了 AI 绘画的“关键字” prompt 概念,开始绞尽脑汁想着自己独特的“魔法咒语”。

而在 2022 年的最后一个月,我们突然发现也许不用多么复杂的“咒语”也能呼唤出我们真正想要的信息结果。

NLP 技术的快速爆发让所有人都猝不及防,也许在不知不觉间中一个全新的时代已经来临。

目前 ChatGPT 没有通过互联网检索信息的能力,因此在一些边界问题上略显无知。此外 ChatGPT 可能因为语料缺失的原因导致了它对于中文语料的陌生。

f8bb12cf7b030a8188a5a6280d386bf1.jpeg

(关二爷:俺是俺儿子?!?)

416f5adb826a3b9067ee26c8ffea1125.png

卖萌屋作者:天于刀刀

注重 WLB 的工业界反卷斗士,未进化的 NLP 咸鱼一条。专注于研究在各个场景中算法模型的落地情况,希望自己编写的算法有朝一日可以改变世界。目前的兴趣点在于:假新闻检测、深度学习模型可解释性等。

作品推荐

1.腾讯薪酬改革来了!晋升≠加薪?员工到底为何工作?

2.从 Google AI 离职了,这里让我爱不起来

3.百万悬赏!寻找“模型越大,效果越差”的奇葩任务!

4.想通这点,治好 AI 打工人的精神内耗

0955980683113d3c0eadcf3102cb589e.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜广推与求职讨论群

664da2e3d524b42ea1a319c55708c855.png

[1]https://twitter.com/jdjkelly/status/1598021488795586561

[2]https://chat.openai.com/chat

[3]reStructured Pre-training, https://arxiv.org/abs/2206.11147

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/62089.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Nginx配置实例-负载均衡

随着互联网信息的爆炸性增长,负载均衡(load balance)已经不再是一个很陌生的话题, 顾名思义,负载均衡即是将负载分摊到不同的服务单元,既保证服务的可用性,又保证响应 足够快,给用户…

Nginx安装搭建和环境准备教程(Ubantu)

本文以Ubantu18.08为例: 首先进入虚拟机中升级apt-get: apt-get update nginx进行安装: apt install nginx 使用命令查看nginx是否启动: systemctl status nginx nginx已经启动,可以到前端页面去访问是否真的已经启…

Vue项目中使用AntV G6绘制自适应图谱

Vue项目中使用AntV G6绘制自适应图谱 一、需求 需求1:Vue3.x项目下使用AntV G6绘制图谱 需求2:图谱节点为两个IP地址,节点间存在多条连线情况 需求3:鼠标悬浮到节点上方时,高亮当前节点并出现tooltip气泡提示&#…

Blackmagic黑魔法摄像机braw视频文件修复方法

Blackmagic是全球知名的影视级产品供应商,其高清摄像机是国内外各种剧组的最爱。Blackmagic的新产品目前使用braw格式,其编码采用自定义的raw编码,视频的效果和阿莱不相上下。近期我们处理了一例braw损坏无法播放的问题,我们来看看…

网络编程入门

什 么 是 网 络 编 程 网络编程的本质是多台计算机之间的数据交换。 数据传递本身没有多大的难度,不就是把一个设备中的数据发送给其他设备,然后接受另外一个设备反馈的数据。 现在的网络编程基本上都是基于请求/响应方式的,也就是一个设备发…

[附源码]计算机毕业设计基于springboot的小区宠物管理系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

css样式引入方式及优缺点

这篇文章主要介绍了css样式引入及优缺点,本文给大家分享三种css的引入方式,通过代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧 三种css的引入方式 1.行内样式 优点:书写方…

【Python自然语言处理】文本向量化处理用户对不同类型服装评论问题(超详细 附源码)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~ 下面以文本向量化为目标,举例说明基于不同模型的实现过程,使用的数据集的主题是用户对不同类型的女性服装的评论,总共有23485条记录 实现步骤如下 一、导入库文件 首先导入需要的库文件…

MySQL数据库日志、备份与恢复

目录 前言 一.MySQL 日志管理 数据的重要性 造成数据丢失的原因 1、错误日志 2、通用查询日志 3、二进制日志 4、慢查询日志 5、查看日志 6.中继日志(relay log) 7、普通日志(general log) 配置文件 二、数据库备份的…

Metabase学习教程:系统管理-4

序列化:在Metabase实例间迁移 如何使用Metabase的序列化功能将问题、仪表板、集合、设置等从一个Metabase实例复制到新的Metabase实例。 Metabase序列化 序列化仅在商业版上可用(仅在自托管计划上)。 许多客户在迁移到本地部署的商业版时…

二叉树OJ题详解

第一题:单值二叉树 力扣链接:力扣 单值二叉树就是每一个节点存放的数据都相同,那么如何判断一棵树为单值二叉树呢?我们就拿最简单的一棵树为例子,比如根节点为1它的左子树和右子树也为1的一棵树,我们只需要…

以太网 TCP协议(TCP报文交互后的状态机变化)

2.7.2 以太网 TCP协议(TCP报文交互后的状态机变化) 一、TCP状态机: 二、TCP状态机变化 1、TCP三次握手 客户端主动发起SYN置位TCP之后,状态变为SYN_SENT(请求发送状态)服务器默认处于LISTEN(监听状态)。收到SYN报文之后&#x…

VMwareWorkStation如何添加万兆网卡,万兆网卡添加教程

1.引言 不同于ESXi,在VMware WorkStation(后文简称VMware)中添加网卡后没有选择网卡速度等级的选项,例如百兆、千兆、万兆等。就算点开右下角的”高级“也不管用。不过按照VMware的默认设定,当新建虚拟机选择32位操作系…

【玩转STL】STL的简介和string类用法和接口讲解(源码解析)

接触编程时间长一点的朋友想必都多多少少听过vector、string、queue等容器,也大抵了解一些有关STL的概念,这一节,我们就一起来谈一谈STL的六大组件,再来一起深入理解string类。 这里写目录标题🍎、什么是STL&#xff0…

人工智能:语音合成技术介绍

❤️作者主页:IT技术分享社区 ❤️作者简介:大家好,我是IT技术分享社区的博主,从事C#、Java开发九年,对数据库、C#、Java、前端、运维、电脑技巧等经验丰富。 ❤️个人荣誉: 数据库领域优质创作者🏆&#x…

PCL 点云采样

一、简介 点云采样一般有三种方式,上采样,下采样,平均采样 原理介绍 下采样: 一般是采样是通过构建一个三维体素的格栅,然后在每个体素内用体素的重心近似的作为这个体素的整体特征,也就是说用这一个体素…

python 拆分pdf(有可执行文件exe)

1.背景 被那些软件pdf拆分整气死了,今天用python写一份pdf拆分的代码。 2.代码:(计算机的可以去学习一下,自己改改) pdf_split.py from PyPDF2 import PdfFileReader, PdfFileWriter# PDF文件分割 def split_pdf():…

pytorch nn.utils.rnn.pack_padded_sequence 分析

pack_padded_sequence 在nlp模型的forward方法中,可能有以下调用令读者疑惑 packed_embedded nn.utils.rnn.pack_padded_sequence(embedded, text_lengths, batch_firstTrue, enforce_sortedFalse)为什么要使用pack_padded_sequence? 参考 Pytorch中…

TDengine3.0:解决高基数问题的时序数据库设计思路

小 T 导读: 数据集的高基数(High-Cardinality)问题一直困扰着诸多主流的时序数据库(Time Series Database,TSDB)产品。一些数据库管理系统,在基数较低时表现良好;但是随着基数的增加…

vue2.x与vue3.x中自定义指令详解

🐱个人主页:不叫猫先生 🙋‍♂️作者简介:前端领域新星创作者、华为云享专家、阿里云专家博主,专注于前端各领域技术,共同学习共同进步,一起加油呀! 💫系列专栏&#xff…