2023 谷歌I/O发布会新AI,PALM 2模型要反超GPT-4,一雪前耻!

news2024/10/5 18:24:38

文章目录

    • 1 前言
    • 2 Google I/O 发布者大会
    • 3 PaLM 2模型
    • 3 Bard项目
    • 4 其他AI工具
      • 4.1 AI 图片编辑 Magic Editor
      • 4.2 Duet AI 办公
      • 4.3 Universal Translator 翻译工具
      • 4.4 Google 沉浸式导航
      • 4.5 Google 搜索引擎
    • 5 讨论

1 前言

每年必看两大会,苹果发布会谷歌发布会,除了英语听力磨耳朵,看看库克飞檐走壁,吃瓜掉链子外,关注前沿技术,更是为了感受科技改变生活,本篇文章仅围绕人工智能AI方面进行描述:

谷歌其实一直都是AI的老牌公司,眼看这一年被ChatGPT力压火的一塌糊涂,抢尽风头。去年OpenAI的ChatGPT突然发布确实是波**“偷袭”,措不及防。谷歌在2月才匆匆发布第一代Bard“应付”**一下,但是首次亮相就自信的出错。当时示例是“我可以告诉我 9 岁的孩子关于詹姆斯·韦伯太空望远镜的哪些新发现?”查询读取。机器很快吐出三个想法,包括最后一个想法,“JWST 拍摄了我们太阳系外行星的第一张照片。但并非JWST拍摄的。2004 年,这一荣誉属于欧洲南方天文台的甚大望远镜 (VLT),美国宇航局证实了这一点。

有小伙伴就会问,**怎么这么扣细节?ChatGPT不也经常语无伦次吗?**非也,关于ChatGPT可以回看这篇文章,排除个别网友故意训练错误信息(即保证数据库纯净)外,需要正确的提问(引导)才能得到正确的回答:https://mp.weixin.qq.com/s/o4MeE_x0YwPVzSrybyoEVg

还有的小伙伴可能觉得AI这个话题年年谈,年年有,是不是要近饱和了?也不是,打个比喻,人们在冰海上远远的发现一块“浮冰”,有破冰船了接近一看发现是个冰山,等有条件下潜了才渐渐发现“真理面纱”。确实是越探索,知道的越多越觉得无知

AI从未接近饱和,甚至可以说是刚开始,才刚摸到门槛。

2 Google I/O 发布者大会

北京时间5月11日凌晨,**「Google I/O 发布者大会」**亮相,全会围绕“Making AI more helpful for everyone”让人工智能对各个领域各尽所长。

目前还未恰到饭,侧重点在于PaLM 2模型、Bard和其他相关的AI工具。

3 PaLM 2模型

OpenAI的GPT-4模型现在公认一家独大,现谷歌宣布PaLM 2可以一战,下述内容基于谷歌发表的技术报告

其中提到三大亮点:

  • 多语言性: PaLM 2 在多语言文本方面接受了更多的训练,涵盖 100 多种语言。这显着提高了它在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力,这是一个很难解决的问题。PaLM 2 还通过了“精通”级别的高级语言能力考试。
  • 推理: PaLM 2 的广泛数据集包括科学论文和包含数学表达式的网页。因此,它展示了逻辑、常识推理和数学方面的改进能力。
  • 编码: PaLM 2 在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长 Python 和 JavaScript 等流行的编程语言,但也可以生成 Prolog、Fortran 和 Verilog 等语言的专用代码。

这里是对比于PaLM1代,也是在文件中提到放在第一位的就是语言能力。按照CEFR定义,每场写作考试都由三位专业的母语人士进行评分,PaLM 2的日语达到了A/特别A级,在法语方面达到了C1级。这个是很有用的,做科研的都知道,一定条件下机翻是永远替代不了原生语言,不然润色服务也不会这么盆满钵满了。

解释翻译的波斯谚语的含义,挺有意思的,能理解深意,还是着重在**“会思考”**,这是区别人工智能和人工机器的一大关键点。

这是各语言下1代和2代的一个ROC评分,可以理解为是准确性,越高越好


横向对比12种编程语言评估,可以理解为与人工作的一个编码的准确性,也是越高越好

3 Bard项目

Bard是和ChatGPT一样是个语言模型,中文名字叫巴德,就是在今天凌晨,谷歌已经取消wait list名单了,直接开放于180个国家和地区,和微软一样重磅,微软是在五一期间开放了New Bing,但是每天只能问20个问题,笔者还在测试中,埋个伏笔。

Bard是搭载了PaLM2模型的,按技术报告来看应该是挺牛的,据说编程能力更胜一筹,大家可以体验一下,不过暂不支持中文,Bard网址:https://bard.google.com/

有意思:

4 其他AI工具

4.1 AI 图片编辑 Magic Editor

这一张是调色,然后把长椅移到画面中间以保持空间填充,精神抖擞。不过还是小有瑕疵,观察一下长椅的阴影,但是笔者认为比起iPhone14Pro的高度锐化和三星的“创造月球照片”好多了:

Google 分享了几个 Magic Editor 的实际应用示例,它们都非常酷。在一张人在瀑布前的照片中,谷歌将人完全移到照片的一侧,抹去背景中的人,并使天空更蓝。

无法上传GIF,可移步到下方公众号查看原文

听说该工具会优先登陆于谷歌的Pixel手机。

4.2 Duet AI 办公


涵盖了一系列适用于 Google 生产力应用程序的生成式 AI 工具。正如我们今年早些时候详述的那样,这包括 Docs 和 Gmail 中的写作帮助、幻灯片的图像生成、Meet 的自动会议摘要等等。但在谷歌 I/O 上,唯一真正的新闻是写作辅助也将出现在移动版 Gmail 中,它将被标记为“帮我写”——Smart Compose 的升级版。

  • 轻松生成专业化的岗位描述
  • 在Gmail将会议记录转换成电子邮件
  • 还有很多~~~~

但是使用仍需加入workspace的waitlist,只能等了
网址:https://workspace.google.com/labs-sign-up/

4.3 Universal Translator 翻译工具

该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这意味着该实用程序不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情。输出的人说话视频会根据目标语言的发音同步嘴唇的动作。

如上图所示,Universal Translator 首先检测单词并进行翻译。然后,它会检查说话者的语气以及他们强调的内容。结合这两个方面后,它会生成目标语言的语音。最后,它会根据 AI 生成的语音的发音同步视频中说话者的嘴唇。

但是一向注重版权的歪果仁肯定会考虑到安全这点,所以会限制一般用户,需要授权通过才能使用。

4.4 Google 沉浸式导航

谷歌地图一直都很牛,不少人用过Google Earth,好评连连吧。这一次升级体现在**“沉浸式”,新视图将填充 3D 建筑、植被,为用户提供更好的视角,在展示街道及其周围环境的同时提供更多细节。用户不仅可以实时查看所有这些信息,还可以调整时间以查看天气和交通在过去几个小时内可能发生的变化,实现真正的云游**。

这个功能在夏季推出,到 2023 年底将在 15 个城市推出。

4.5 Google 搜索引擎

这个功能放在最后,与 Microsoft 的Bing体验类似,这个新面板中有一些东西,所有这些都是为了让你在输入更自然的搜索提示时一目了然的信息。

该体验即将登陆谷歌实验室,并将在未来几周内推出,还是要申请waitlist

5 讨论

人工智能的发展其实在第一波ChatGPT惊雷后是没有太大感觉差异的,因为后续的更新换代和接二连三的同台竞技产品(文心一言、阿里的AI、和鲸的AI等),即便是很多镜像的,“国产ChatGPT”,都是大语言模型,一代又一代只是算法上的优化和扩大模型,在我们的基础使用体验上并没有太大差别。

笔者觉得人工智能现在掀起的波浪其实遍布各个方向,只不过我们大多数人都只关注于文本聊天模型,所以还没接触到真正的“AI改变生活”,不过这个交给专业团队,交给工业界了,外行看热闹,内行看门道,作为不涉及研发,不涉及开发的我们,看着门道的热闹也是可以的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/513184.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

搭建AI虚拟数字人是一项复杂的任务,需要掌握多个技术领域的知识,包括机器学习、自然语言处理、计算机图形学等。

搭建AI虚拟数字人是一项复杂的任务,需要掌握多个技术领域的知识,包括机器学习、自然语言处理、计算机图形学等。以下是搭建AI虚拟数字人的一般步骤: 确定需求和功能:首先需要确定虚拟数字人的用途和需要实现的功能,例…

精心设计的ChatGPT网页版源码最聪明的镜像ChatGPT

demo软件园每日更新资源,请看到最后就能获取你想要的: 1.精心设计的 ChatGPT网页版源码 最聪明的镜像ChatGPT ChatGPT网页版源码 最聪明的镜像ChatGPT 支持GPT3.5turbo以及GPT4.0turbo的各种版本模型 精心设计的 UI,响应式设计,支持深色模式 极快的首…

【LeetCode】932. 漂亮数组

932. 漂亮数组(中等) 解法一:分治法 重点 这里给出两个定理: 如果 X,Y,Z 是漂亮数组,则 k * X b, k * Y b, k * Z b 一定也是漂亮数组;奇数 偶数 奇数。 因此不难证明,如果 2 * Y ≠ X…

vue+elementui写了一个图书管理系统

用vueelementui写了一个图书管理系统 转载自公号:java大师 目前是指一个纯前端的展示,后端还在开发中,前端接口是通过json-server模拟的 用到的技术栈 1、vue.js 2、elementui 3、json-server 4、axios 5、vue-router 动态路由 目录结构…

Java每日一练(20230511) 有效数字、重复元素II、类和子类

目录 1. 有效数字 🌟🌟🌟 2. 存在重复元素 II 🌟🌟 3. 设计学生类Student和它的一个子类Undergraduate 🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专…

基于postgresql传统数据仓库搭建

目录 概述数仓选型对比当前数仓架构问题解决方案 架构设计数据仓库设计命名规范模型设计 PostgreSQL的安装数据仓库的建立创建数据库创建用户组创建用户用户加入到用户组创建模式模式授权用户收回函数的执行权限公开表的select权限动态sql函数集中处理函数 fdw实现数据抽取安装…

ChatGPT与Discord无缝接入指南,获取你的专属聊天机器人

ChatGPT与Discord无缝接入指南,获取你的专属聊天机器人 一、获取OpenAI API密钥。二、获取Discord Token三、注册GitHub,有账号的可以直接登录。四、在线开发环境搭建Replit五、注册cron-job.org本教程收集于: AIGC从入门到精通教程 ChatGPT和Discord都非常流行,而在Disco…

基于RK3588s人工智能大算力多网口工业网关交换机,可接5路千兆高清相机

RK3588/RK3588S AI BOX 功能接口说明 接口需求 功能定义与要求 备注 成本与目标 硬件设计争取全国产化, 632GB 版本 RK3588S PCBA 尺寸 146*102 丝印版本号 RK3588S AI BOX V1.0 EMMC 支持 SanDisk SDINBDA4-32/64/128G 4G-8GB 标配 8GB …

tensorboard如何使用

神经网络本身比较难理解,看起来很神秘,所以我们可以借助可视化根据tensorboard关注神经网络的运行过程,其中包括了各项数据指标以及神经网络自身的图结构。 TensorBoard 是 TensorFlow 的可视化工具,可以帮助用户更好地理解和调试…

【Linux】项目自动化构建工具make/makefile

🏖️作者:malloc不出对象 ⛺专栏:Linux的学习之路 👦个人简介:一名双非本科院校大二在读的科班编程菜鸟,努力编程只为赶上各位大佬的步伐🙈🙈 目录 前言一、make/makefile的背景二、…

00后卷起来,真没我们老油条什么事了···

都说00后躺平了,但是有一说一,该卷的还是卷。 这不,前段时间我们公司来了个00后,工作没两年,跳槽到我们公司起薪20K,都快接近我了。后来才知道人家是个卷王,从早干到晚就差搬张床到工位睡觉了。…

Android 中你碰不到但是很重要的类之ActivityThread

作者:Drummor 通过本文能了解一下内容 1、和系统进程打交道的桥头堡 应用进程起来之后ART(Android Runtime)第一站就是ActivityThread,代码层面上就是ActivityThread的main()方法,是不是很熟悉,爷青回啊,这不就是java…

基于深度学习的动物识别系统的实现

项目介绍 动物识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对18种动物数据集进行训练,最后得到一个识别精度较高的模型。并基于Django框架,开发网页端操作平台&…

数据分析师 ---- SQL强化(3)

数据分析师 ---- SQL强化(3) 题目:每个月Top3的周杰伦歌曲 从听歌流水中找到18-25岁用户在2022年每个月播放次数top 3的周杰伦的歌曲 输入例子: drop table if exists play_log; create table play_log (fdate date,user_id int,song_id int ); inser…

前端的培训计划书

文章目录 导文模板一一、前言二、培训目标三、培训内容和计划 模板二模板三 导文 这里是导文 模板一 一、前言 随着互联网的快速发展,前端开发已经成为了现代软件开发中一个不可或缺的重要技能。本次培训旨在帮助学员快速掌握前端开发的核心知识和技能&#xff0c…

ChatGPT实现撰写邮件

撰写邮件 电子邮件是日常工作中很常用的工具,在相对正式的场合,一封格式美观、用语典雅的电子邮件正文会起到很好的作用。ChatGPT 可以较好的完成电子邮件的编写和格式美化工作。 下面让我们以产品销售的角度,写一封推销邮件。假定产品名称…

String类 [中]

目录 一、 string 的深浅拷贝 0x00 构造函数与析构函数的实现 0x01 拷贝构造 0x02 赋值 0x03 整体代码 二、 string的实现 0x01 引入 0x02 c_str 0x03 默认构造函数 三、size()与operator[]的实现 0x01 size()的实现 0x02 operator[]的实现 0x03 遍历实现 四、迭代器…

洛谷B2098 整数去重

整数去重 题目描述 给定含有 n n n 个整数的序列,要求对这个序列进行去重操作。所谓去重,是指对这个序列中每个重复出现的数,只保留该数第一次出现的位置,删除其余位置。 输入格式 输入包含两行: 第一行包含一个…

获取两个日期间时长 (XX天XX时XX分)

使用场景: 发货日期与到货日期 计算运输时长 代码: private String getMinuteTime(String startTime, String endTime) {String minuteTime null;if (StrUtil.isNotBlank(startTime) && StrUtil.isNotBlank(endTime)) {long minute DateUti…

【芯片设计- RTL 数字逻辑设计入门 2 - vcs 及 verdi 使用介绍】

文章目录 1.1 VCS 编译环境1.1.1 Complie Design1.1.2 simv 仿真 1.2 VCS 波形生成及查看1.2.1 verdi 命令介绍1.2.2 verdi 波形查看 1.1 VCS 编译环境 VCS 全称是 Verilog Compiler Simulator,是 Synopsys 公司的,类似于windows环境下的 questasim 或 …