PaLM 2全面反超反超GPT-4,谷歌官宣AI重构搜索,朝着ChatGPT微软开炮

news2024/11/24 10:55:14

来源 | 量子位 | 公众号 QbitAI

万众瞩目,谷歌的反击来了。

现在,谷歌搜索终于要加入AI对话功能了,排队通道已经开放。

当然这还只是第一步。

大的还在后面:

全新大语言模型PaLM 2正式亮相,谷歌声称它在部分任务超越GPT-4。

Bard能力大更新,不用再排队等候,并支持新语言。

谷歌版AI办公助手也一并推出,将在Gmail中抢先亮相。

谷歌云也上线多个基础大模型,为行业提供更进一步的生成式AI服务……

在最新一届I/O开发者大会上,谷歌的大放送真的太震撼。

有网友直呼:

AI大战全面开启。

有人甚至表示:

现在我后悔为ChatGPT付费了。

一场发布会结束,谷歌股价上涨超4%。

PaLM 2部分任务超越GPT-4

毫无疑问,PaLM 2是今年I/O大会的重中之重,由皮查伊亲自做介绍。

目前的Bard以及谷歌超过25个AI产品和功能,现在都由PaLM 2作为底层技术支持。

作为谷歌目前最先进的大模型,PaLM 2基于Pathways架构,是PaLM的升级版,通过JAX在TPU v4上构建。

据介绍,PaLM 2接受了100多种语言的训练,这使得它在语言理解、生成和翻译上的能力更强,并且会更加擅长常识推理、数学逻辑分析。

谷歌表示,PaLM 2的数据集中有海量论文和网页,其中包含非常多数学表达式。在这些数据的训练后,PaLM 2能轻松解决数学问题,甚至是制作图表。

编程方面,PaLM 2现在支持20种编程语言,如Python、JavaScript等常用语言,以及Prolog、Fortran和Verilog等。

这一次谷歌一并推出了四种不同size的PaLM 2。

他们用不同的动物来体现规模大小。最小的是“壁虎”,最大的是“独角兽”。

其中“壁虎”版本是非常轻量级的,能在移动设备上快速运行,包括离线状态;每秒可处理20个token。

DeepMind副总裁在I/O大会前的新闻发布会上表示:

我们发现模型并不总是越大越好,这也是为什么我们决定提供一系列不同规模的模型。

这意味着微调PaLM 2会更加方便,由此它也能支持更多产品和应用。

在I/O大会上,谷歌就宣布了现在已经有超过25个产品和应用正在使用PaLM 2的能力。

具体的表现形式,就是Duet AI

可以将它理解为微软365 Copilot的对标产品,是一个能够内嵌在各种办公软件中的AI助手。

谷歌在发布会现场已经展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。

包括根据提示补充邮件内容、生成PPT、根据提示生成图片素材、一键生成表格等。

同样,这个AI助手也能提供编程帮助。基于谷歌云,它能实时推荐、纠错代码块,并且以对话方式解答编程问题,目前支持Go、JavaScript、Python和SQL。

另外基于PaLM 2,谷歌还推出了一些专业领域大模型。

谷歌的健康团队打造了Med-PaLM 2。它能回答各种医学问题,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。

目前谷歌正在尝试让它具备多模态能力,比如自己检查X光片后给出诊断。在今年夏天晚些时候,这个模型将对一小部分谷歌云用户开放。

另一个专业大模型是Sec-PaLM 2。

这是一个面向网络安全维护的大模型,它能分析和解释潜在的恶意脚本,并检测脚本的危险性。

那么,在展示了PaLM 2一众卓越能力后,就该聊聊怎么开放使用了。

谷歌表示,现在可以通过PaLM API接口、Firebase和Colab使用PaLM 2。

Bard全面开放,支持图片、集成自家地图等应用

对标ChatGPT的Bard终于取消排队试用,在全球180+国家和地区进行全面开放了。

新增黑暗模式,备受程序员好评:(手动狗头)

除了扩大访问范围,Bard也在英文之外,新增直接用日语和韩语对话的功能。中文看起来还得再等下一波——谷歌表示,很快就会新增到40种语言版本。

由于从今天起,Bard将全面接入PaLM 2,所以它在编程和推理上面的能力也有了很大的提升,代码生成、调试和解释都更加专业(获得程序员认可的那种)。

当你让它用python写一段国际象棋中的“四步杀”(scholar’s mate)招式,里面参考了别的代码,它会给出相关链接,方便你查看。

你可以就它给出代码中某个不懂的函数进行进一步提问,问它能否再改善一下,或者是要求它将所有内容都合并的一个代码块中。

不过,最惊喜的当属应广大开发者要求,加入了一键导入功能

现在,你可以将Bard生成的代码直接导出到Colab。

除了代码,你用Bard生成的任何内容,比如电子邮件草稿、表格什么的也都可以直接拖到Gmail、Docs和Sheets中。

对了,Bard现在的回答中也支持图片了。拿来问旅游攻略最方便不过:

除了它能用图片回答你,你也能直接丢给它图片,比如上传一张两只狗狗的照片,让它来帮你编点好玩的故事:

这个功能由Google Lens(一款能让机器学会“看图说话”的AI应用)提供支持。

除了Google Lens,Docs、Drive、Gmail、地图等多个谷歌自家的应用能力也整合到了Bard之中。

比如在Bard的回答中直接用谷歌地图查看几所大学的地理位置:

有种现在要用谷歌的各种产品,只用Bard一个入口就够了的感觉。

除了自家应用,Bard这次还把Adobe Firefly给搬了上来,各种有版权的创意图像用对话就可以“信手拈来”:

搜索重构,加入AI对话

千呼万呼,谷歌搜索终于开启了AI对话的能力。

“一家带有一个不到3岁孩子和一只狗的家庭来说,去布莱斯峡谷还是拱门国家公园游玩更好?”

对于这个问题,搁以前,你可能需要自己把它拆成各种小问题去搜索引擎整理大量信息,最终才能找到答案。

现在谷歌让你尽量一步到位。

如图所示,谷歌搜索没有简单地搬运搜出来的答案,而是将孩子和狗这两个因素都考虑进去给出整理后的回答,比如它说:

布莱斯峡谷有两条狗能进入的环路,对婴儿车也十分友好;拱门国家公园则大部分路段都不允许宠物进入;两个地方都要求宠物拴上皮带等。

每句话都有具体的依据链接供查看:

除此之外,它还会显示了来自不同网站网友发布的攻略链接。

最重要的是,你可以对它的回答进行进一步对话式的提问,点击“ask for a follow up”按钮即可。

用新的谷歌搜索进行购物也非常有趣,它号称可以帮你迅速做出理性的购买决定。

比如当你想要一辆“适合5英里山地通勤的自行车”,它会先告诉你挑选之前需要考虑的重要因素,比如:

一看设计:电动自行车、公路自行车和混合动力自行车等适合通勤;

二看电机和电池,三看减震用的悬架,有山路的通勤需要应对裂纹和颠簸带来的冲击等。

然后再给你推荐合适的车,推荐时还会给出具体产品说明、最新评价、价格和图片等全面信息。

你也可以进行进一步提问,比如只要红色电动自行车,它会进一步优化回答。

这个功能由谷歌的购物比价产品Shopping Graph提供支持,它可以搜集并不断更新来自全世界的产品列表。

值得一提的是,谷歌直言更新后的AI搜索界面照样会植入广告,但放心:它只会在专用广告位中出现,不会混进你的搜索结果中。

最后,这个新功能目前还只能在谷歌Search Labs中申请试用,且仅限美国地区的用户体验。

三大基础模型上线谷歌云

今年I/O大会,谷歌云的内容也同样抢眼。

在更新了一大波AI能力后,谷歌为自家云端机器学习平台Vertex AI,上新了三款大模型:

  • Codey:text-to-code,帮助程序员写代码

  • Imagen:text-to-image,生成高质量图像

  • Chirp:speech-to-text,方便沟通

这三种模型的能力其实在今天的发布会上都有展示过,比如生成代码、谷歌照片智能编辑等。

除此之外,在Vertex AI上现在还能使用文本和图像的嵌入式API。它支持将文本和图像数据转换为多维数值向量、映射语义关系,从而允许开发者创建出更加有意思的应用。

另一个重大更新则在RLHF上,谷歌表示他们是首个将此功能作为托管服务放到端到端机器学习平台行的。好处是能让企业结合RLHF快速训练奖励模型,用于微调基础模型,这对于大模型在行业应用中的准确性提升非常关键。

除了模型方面,谷歌云在训练上还推出了下一代A3 GPU超算。通过将A3虚拟机和Nvidia H100结合,谷歌云能够提供更大的计算吞吐量和带宽,能够让企业更快开发机器学习模型。

除了这些,谷歌这次还带来售价1799美元(合人民币约1万2)的首款折叠屏手机等新硬件产品,以及接入AI功能的Android 14系统(比如提供信息回复建议什么的),这里就不一一展示了。

总的来看,作为第15届I/O大会,谷歌这次着实给大家带来了非常多的干货。

值得一提的是,这次上台介绍的发言嘉宾,已不见Jeff Dean的身影,他前几日刚刚职级变动。

作为从前Google AI最代表性发言的高管,在AI 2.0浪潮里,将何在?

谷歌是否还能在大模型和AI搜索领域中奋起追上,也值得期待。

你对这次谷歌的反击,满意吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/518797.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

IT行业项目管理软件,你知道多少?

IT行业项目管理软件,主要得看用来管理的是软件研发还是做IT运维。如果是做软件研发,那还得看项目经理是用什么思路,是传统的瀑布式方法还是敏捷的方法或者是混合的方法。 如果用来管理的是IT运维工作,那么很多通用型的项目管理软件…

微服架构基础设施环境平台搭建 -(三)Docker+Kubernetes集群搭建

微服架构基础设施环境平台搭建 -(三)DockerKubernetes集群搭建 通过采用微服相关架构构建一套以KubernetesDocker为自动化运维基础平台,以微服务为服务中心,在此基础之上构建业务中台,并通过Jekins自动构建、编译、测试…

【python/request/HTMLTestRunner/unittest】接口自动化测试框架

正在调研使用python进行自动化测试,在网上发现一篇比较好的博文,作者使用的是python3,但目前自己使用的是python2,先转载下,后续再进行调试完善; 摘要: python requests实现的接口自动化框架详细教程 前…

VMware Aria Operations for Networks 6.10 - 网络和应用监控工具

VMware Aria Operations for Networks 6.10 - 网络和应用监控工具 请访问原文链接:https://sysin.org/blog/vmware-aria-operations-for-networks/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.org VMware Aria Oper…

Goby 漏洞更新 |WordPress Welcart e-Commerce 插件 content-log.php 文件 logfile 参数文件读取漏洞

漏洞名称:WordPress Welcart e-Commerce 插件 content-log.php 文件 logfile 参数文件读取漏洞 English Name:WordPress plugin Welcart e-Commerce content-log.php logfile File Read Vulnerability CVSS core: 9.8 影响资产数:5453 漏…

【操作系统】《2023 南京大学 “操作系统:设计与实现” (蒋炎岩)》- 知识点目录

《2023 南京大学 “操作系统:设计与实现” (蒋炎岩)》 1. 操作系统概述 (操作系统的历史;学习建议) [南京大学2023操作系统-P1] 1.1 Z3库:解决逻辑定理证明问题 Z3是由微软研究院开发的一个高效的定理证明器,用于解决逻辑定理证…

日撸 Java 三百行day50

文章目录 说明day50 小结1.比较分析各种查找算法.2.比较分析各种排序算法3.描述各种排序算法的特点和基本思想4.设计一个自己的 Hash 函数和一个冲突解决机制 说明 闵老师的文章链接: 日撸 Java 三百行(总述)_minfanphd的博客-CSDN博客 自己…

利用PostgreSQL的存储过程为多个库表增加固定字段

曾经只会增删改查和内置函数的SQL使用,第一次发现原来自定义函数/存储过程还是非常可以提高效率的。 背景需求: 需要为某个schema下的表追加字段。 原始手段:为每个表生成插入字段的SQL,执行,要粘贴好多遍表名 / 手…

【K8S系列】快速初始化⼀个最⼩集群

序言 走得最慢的人,只要不丧失目标,也比漫无目的地徘徊的人走得快。 文章标记颜色说明: 黄色:重要标题红色:用来标记结论绿色:用来标记一级重要蓝色:用来标记二级重要 希望这篇文章能让你不仅有…

华为OD机试真题 Java 实现【贪心的商人】【2023Q1 100分】

一、题目描述 商人经营一家店铺,有number种商品,由于仓库限制每件商品的最大持有数量是item[index],每种商品的价格在每天是item_price[item_index][day],通过对商品的买进和卖出获取利润,请给出商人在days天内能获取…

扫雷---C语言

目录 前言: 1.认识扫雷 1.1游戏构思 1.2碎碎念 2.扫雷接口实现 2.1菜单打印 2.2创建标识符常量和初始化数组 2.3打印棋盘 2.4随机埋雷 2.5排查雷 3.源码 3.1头文件和函数原型声明game.h 3.2游戏函数实现game.c 3.3测试代码文件test.c ❤博主CSDN:啊…

HEVC编码标准介绍

视频编码标准的发展历程 目前已经有H266、AVS3、AV1等新编码标准。 H264的编码劣势 宏块个数的爆发式增长,会导致用于编码宏块的预测模式、运动矢量、参考帧索引、量化等宏块级参数信息所占用的码字过多,用于编码残差部分的码字明显减少;…

C++实现并查集

1.并查集原理 在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个 单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一 个元素归属于那个集合的运算。适合于描述这类…

编译原理----词法分析设计

程序设计实验1 词法分析 一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 二、实验内容 编制一个单词获取程序,从文件…

门店销售干货 | 4种不同类型的顾客VS销售技巧,直接套用!

“我就路过随便看看” “我在别人家看到的更便宜” “我自己看,你不要跟着我” “我下次再买” …… 在日常的门店经营过程中,你是否经常遇到不同类型的顾客,用各种不同的话拒绝你,最后成交的寥寥无几。 面对不同这样不同类型…

java异常总结

java异常总结 什么是异常? 在Java中,将程序执行过程中发生的不正常行为称为异常。 常见异常举例 1.算数异常ArithmeticException public class Test{public static void main(String[] args) {System.out.println(10/0);} }报错 ArithmeticExcept…

webhub123整理 中文语音识别数据集​

我们收集和整理了常用的中文语音识别数据集,合计超过12000小时的数据集。已经按照不同来源整理收录到 webhub123整理 中文语音识别数据集​https://www.webhub123.com/#/home/detail?projectHashid64335220&ownerUserid22053727 整理后的效果如下 ​ 每个卡片…

mysql Lock wait timeout exceeded; try restarting transaction

文章目录 一、mysql死锁及超时的原因二、mysql死锁排查思路1、show full processlist 查询当前数据库全部线程2、information_schema 一、mysql死锁及超时的原因 当在业务逻辑中看到这个错误,或者mysql中使用update语句更新数据报错: Lock wait timeout…

数影周报:丰田215万名日本客户信息被无意泄露,菜鸟将于明年初在港IPO

本周看点:丰田215万名日本客户信息被无意泄露;美光宣布吴明霞出任美光中国区总经理;谷歌将向Gmail用户提供暗网数据泄露报告;淘宝天猫集团架构调整完成;菜鸟计划于2024年初在香港IPO...... 数据安全那些事 丰田215万名…

体验了基于ChatGPT的谷歌翻译插件后,我把其他翻译插件移除了

最近,一个基于 ChatGPT 的谷歌浏览器翻译插件挺火的,我体验了下,总结下来就一个字“666”。 github 上已经有 14.9k 的 star 了 传送门:GitHub - yetone/openai-translator: 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端…