OpenAI 又赢麻了谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4

news2024/11/18 1:32:47

89c7c633884705ad2b2a017270dbcaaa.jpeg


整理 | 褚杏娟,核子可乐

谷歌在上个月的开发者大会上公布了一系列 AI 新项目,当时首次亮相的 Gemini 曾受到不少嘲讽。但近日,DeepMind 联合创始人兼 CEO Demis Hassabis 自曝,工程师们正在使用 AlphaGo 的技术来开发 Gemini,其强大程度有望超越 OpenAI 的当家花旦 ChatGPT。

在 AlphaGo 的加持下,Gemini 瞬间备受关注。在 2016 年,谷歌 DeepMind 人工智能实验室打造的 AlphaGo 程序成功击败围棋世界冠军,写下了 AI 发展史上的一页新篇章。

仍在开发当中的 DeepMind Gemini 是一套专门处理文本的大语言模型,其本质与 ChatGPT 家族的 GPT-4 相似。根据此前的介绍,Gemini 一开始就以多模式、高效的工具和 API 集成为目标而创建,旨在支持未来的创新,例如内存和规划。经过微调和严格的安全测试后,Gemini 将提供各种尺寸和功能。

现在,Hassabis 表示,他的团队将 GPT 技术与 AlphaGo 的特性加以结合,希望赋予系统规划和解决问题的新能力。“从宏观来讲,大家可以把 Gemini 理解为结合了 AlphaGo 系统优势与大模型令人惊叹的语言能力。我们还做出了其他非常有趣的创新。”

之前谷歌开发者大会上,谷歌 CEO Sundar Pichai 也说道,“虽然还为时过早,但我们已经看到了之前型号中未曾见过的、令人印象深刻的多模式功能。”

DeepMind: 下一代大模型碾压 GPT-4

要训练出 OpenAI GPT-4 这样的大语言模型,研究人员需要将书籍、网页和其他来源处的大量精选文本输入到 Transformer 机器学习软件当中。模型会利用训练数据中表现出的模式,熟练预测一段文本之后应该出现的一个个字母和单词。这种简单的文本预测机制在回答问题、生成自然语言 / 代码方面被证明拥有强大的潜力空间。

要进一步开发 ChatGPT 及类似功能的语言模型,DeepMind 认为还有另一个重要的附加步骤,就是使用基于人类对 AI 模型答案做出的反馈,进而借助强化学习提高其性能。DeepMind 在强化学习方面的丰富经验,也许能让研究人员为 Gemini 赋予更多新颖能力。

AlphaGo 基于 DeepMind 首创的强化学习技术。这项技术要求 AI 模型在问题之上反复尝试并接收关于性能的反馈,据此设计接下来将要采取的行动(例如围棋或电子游戏),从而让软件一步步学会解决棘手问题。它还采用所谓“树搜索”方法,以探索并记住棋盘上可能采取的各种动作。如果这一思路能够帮助语言模型迎来下一次重大飞跃,则新 AI 或能在互联网和计算机上执行更多种类的任务。

Hassabis 和他的团队也许还会利用 AI 领域的其他思路继续增强大语言模型。DeepMind 研究人员的关注领域涵盖机器人、神经科学等诸多方向。本周早些时候,该公司展示了一种算法,能够学习借助不同类型的机械手臂完成操作任务。

人们普遍认为,跟人类和其他动物一样,AI 的能力提升也需要从现实世界中学习客观经验。一部分 AI 专家相信,语言模型的最大限制就是只能通过文本以间接方式了解世界。

Hassabis 坦言,Gemini 目前仍在开发当中,且整个过程需要几个月时间,成本则在数千万到数亿美元之间。OpenAI 公司 CEO Sam Altman 曾有 4 月表示,GPT-4 的开发成本超过了 1 亿美元。

Hassabis 的任务就是加快谷歌的 AI 开发进度,同时管理种种未知的潜在风险。最近一段时间,语言模型的快速进步已经令 AI 专家(包括部分算法专家)感到担忧,害怕这项技术被恶意滥用或者变得难以控制。某些内部技术人士甚至呼吁暂停开发更强大的算法,避免匆忙之中造成重大威胁。

Hassabis 认为,AI 技术的确拥有巨大的潜在助益,例如在健康或气候等领域推动科学发现,所以人类探索 AI 的脚步绝不能停止。但他也强调,强制叫停研究明显脱离实际,基本没有可行性。“只要处置得当,AI 将成为有史以来对人类最有益的技术成果。我们必须有勇气去追求这样的关键成果。”

这也不是说 Hassabis 在一味强调快速开发 AI 技术。DeepMind 早在 ChatGPT 出现之前,就一直在探索 AI 可能带来的各种风险。该公司联合创始人之一 Shane Legg 多年来一直领导一支内部“AI 安全”小组。Hassabis 上个月与其他备受瞩目的 AI 领袖一道签署了一份声明,警告称 AI 也许有一天会引发与核战争或全球流行病相当的严峻风险。

Hassabis 强调,目前最大的挑战之一就是确定更强的 AI 具体会带来哪些风险。他解释道,“我认为 AI 领域需要在评估测试等方面开展更多研究——这已经是一项非常紧迫的任务”,用以确定新 AI 模型的能力和可控性。为此,DeepMind 可能会逐步向外部科学家开放自己的系统。“希望学术界能够尽早接触到这些前沿模型。”如果此观点得到落实,也许有助于解决科技巨头以外的 AI 专家被排除在最新研究之外的担忧。

那我们究竟要不要为 AI 大爆发这样一个未来而担忧?Hassabis 安慰道,其实没人真能确定 AI 会不会成为一种重大威胁。但他相信,如果 AI 研究继续以目前的速度推进,那业界确实没什么时间制定相应的保障措施。“我能切身观察到我们在构建 Gemini 时的一步步进展,相信这些成果都将发挥预期当中的作用。”

OpenAI: 入驻 DeepMind 大本营

自从 ChatGPT 去年惊艳亮相以来,谷歌很快推出了自己的聊天机器人 Bard,并将生成式 AI 技术应用至搜索引擎及其他众多产品当中。为了增强 AI 研究力度,谷歌公司还于 4 月将 Hassabis 领导的 DeepMind 部门与谷歌另一 AI 实验室 Brain 合并,建立起一个新的谷歌 DeepMind。Hassabis 表示,新团队将汇聚双方最近一段时间为奠定 AI 基础所积蓄的强大力量。“纵观我们在 AI 领域的进展,就会发现 80% 到 90% 的成果都来自这两支队伍。过去十年间,双方也都取得过辉煌的成就。”

Hassabis 本人曾经凭借 AlphaGo 掀起过一波 AI 热潮。所以面对如今这轮技术巨头争相投入的 AI 淘金之风,他显得颇有经验。但另一方面,其竞争对手 OpenAI 的扩张脚步也在继续。

几乎在同一时间,OpenAI 宣布,将在伦敦开设其第一个国际办事处。OpenAI 首席执行官 Sam Altman 表示,当 OpenAI 伦敦办事处将专注于提升“研究和工程能力”,同时平衡与“当地社区和政策制定者”的合作。

值得注意的是,伦敦是谷歌最大的人工智能研究部门 DeepMind 的长期总部基地。鉴于伦敦拥有著名的大学和丰富的学术历史,伦敦也是数据科学人才的源泉。OpenAI 这次海外扩张,将与谷歌在同一个城市近距离竞技。

自 2015 年成立以来,OpenAI 一直没有扩展到旧金山总部以外的地方。Altman 在一份声明先中表示,这次扩张是一次吸引世界级人才的机会。据报道,Altman 也提出将波兰和法国作为该办事处的替代选择。其中,法国也被视为人工智能领域的领导者,谷歌和 Meta 都在巴黎设立了人工智能实验室。

此时,正值 OpenAI 致力于创造利润之际。运行人工智能基础设施并不便宜,半导体研究公司 Semianalysis 层估计 OpenAI 每天的成本约为 700,000 美元。考虑到这一点,英国的企业税比美国和其他欧洲国家低。

广义上讲,伦敦也正在成为人工智能初创企业蓬勃发展的中心。根据最近的一份报告,截至 2021 年,伦敦有超过 1,300 家人工智能公司,就风投资金而言,伦敦也是英国资金最多的城市。

对于 OpenAI 等大量投资人工智能的科技公司来说,伦敦也有很重要的政治地位,这些公司试图说服英国管理机构对人工智能进行宽松的监管。

在最近的一次游说之旅中,Altman 出现在伦敦大学学院,并呼吁“平衡”监管。Altman 威胁称,如果公司无法满足欧盟目前正准备出台的新人工智能(AI)立法规定,OpenAI 可能会“停止在欧盟的运营”。据悉,该法案是人工智能行业第一套综合法规之一。后来,Altman 收回了这些评论。

有趣的是,DeepMind 创始人中的 Demis Hassabis 和 ShaneLegg 就是相识于伦敦大学学院生命科学系的盖茨比计算神经科学小组。

如今,OpenAI 在伦敦的办事处正在大量招聘,涉及各类研发、政策安全等岗位,是否会引发人才流动还未可知。但可以预见,OpenAI 与 谷歌 DeepMind 之间的竞争将会愈发激烈。

参考链接:

https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/

https://techcrunch.com/2023/06/28/openai-brings-the-competition-to-deepminds-doorstep-with-new-london-office/

活动推荐

OpenAI 推出的 ChatGPT 带来了革命性的变化,整个 IT 生态面临大模型(LLM)的洗牌和洗礼。在这个过程中,架构师、工程师会遇到前所未有的挑战和机遇。

在 7 月 21 - 22 日深圳站 ArchSummit 架构师峰会上,我们邀请了出门问问工程 VP 李维博士来会议现场分享最新的研究成果。让你放下焦虑,找到解决思路。点击「阅读原文」查看专题详情。  





本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/700190.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java框架之spring 的 AOP 和 IOC

写在前面 本文一起看下spring aop 和 IOC相关的内容。 1:spring bean核心原理 1.1:spring bean的生命周期 spring bean生命周期,参考下图: 我们来一步步的看下。 1 其中1构造函数就是执行类的构造函数完成对象的创建&#x…

【Java】Java核心 79:Git 教程(2)Git 安装

文章目录 目标内容总结 上一篇我们讲到:Git是一个分布式版本控制系统,常用于协同开发和版本管理的工具。它可以跟踪文件的修改、记录历史版本,并支持多人协同工作。通过Git,你可以轻松地创建和切换分支、合并代码、回滚修改等操作…

Kicad编译

Windows 1.安装visual studio Pro 2019 以上版本,建议2022,自行破解,安装时一定要勾选上cmake工具;安装Git bash 2.去Gitlab上fork kicad的master分支到自己的gitlab仓库上,在本地创建kicad-source路径,初…

【debug】:安装mmcv-full==1.2.4包过程报错

【debug】:安装mmcv-full1.2.4包过程报错This error originates from a subprocess, and is likely not a problem with pip WARNING: Ignoring invalid distribution -illow (d:\anaconda3\envs\pytorch\lib\site-packages) 这是由于安装包过程中曾经出现问题,会影…

生成特定相关系数的变量

本文转载自根据相关性生成变量 已知一组变量a,想要生成另一组变量b,要求a与b之间相关性为c。 实现思路如下: 设固定变量为x1,随机变量x2,相关系数为rho。x1与x2之间的相关性可以转化为向量之间的夹角问题,…

Linux与Windows:操作系统之争及个人体验比较

在当今数码化的世界中,操作系统扮演着关键的角色。Linux和Windows作为最受欢迎和广泛使用的操作系统之一,具有不同的特点和优势。作为一个AI模型,我虽然没有真正的使用经验,但我可以就这两个操作系统进行比较,并提供一…

pointclouds 点云 demo 中的资源文件如pcd找不到的问题

一、问题描述 点云官网提供了许多学习点云类库的例子和demo ,但是在github中找到tutorials后执行 mkdir build cd build cmake .. make 之后却发现没有 资源文件,怎么办 如:pcl-pcl-1.7.2\doc\tutorials\content\sources\normal_estimation…

QVHZO-A-06-3/U0/WG直动式比例流量阀控制器

QVHZO-A-06-3/U0/WG、QVHZO-A-06-12/I/PE、QVHZO-A-06-18/I、QVHZO-A-06-36/U0、QVHZO-A-06-45/I、QVKZOR-A-10-65/I/PE、QVKZOR-A-10-90/I直动式比例流量阀特点: 具有恒压差流量补偿功能 通过比例线圈起动 用于底板安装: 油口安装面符合ISO4401(规格尺寸6和10)…

基于单片机智能温室大棚控制系统

功能介绍 以51单片机作为主控系统; DS18B20温度采集模块检测温度; 光敏电阻和ADC0832组成的光照检测模块; 土壤湿度检测模块检测土壤湿度; CO2检测模块检测CO2浓度; LCD1602显示模块显示测量值、 若温度小于温度最…

Middleware ❀ Zookeeper功能与使用详解

文章目录 1、功能简述1.1 服务目标1.2 文件系统 - 树状结构1.3 数据节点Znode类型1.4 变更通知 - Watcher1.4.1 工作机制1.4.1.1 Client注册1.4.1.2 Server处理1.4.1.3 Client回调 1.4.2 监听特性 1.5 权限控制 - ACL1.5.1 模式 - scheme1.5.2 权限 - Permission 1.6 选举机制1…

Springboot如何手动连接库并获取指定表结构

一、前言🔥 通过,在使用springboot框架之后,就很少涉及到手动连接数据库的方式了,但bug菌有遇到这么一个需求场景,给到你的是无上限的数据库连接信息,要求你能按连接信息指定获取表数据,突然我就…

玩机搞机---另类操作 修改原生卡刷包转换为线刷包方式刷机

偶然给安卓机型刷写原生安卓的系统。可能其第三方twrp原因或者底包原因导致卡刷一直报错。虽然最终写入开机,但浪费时间,究其原因还在于分区切换和挂载分区导致的。写这篇博文的意义不是在于让玩家按步骤转换线刷,只是明白其分区写入的原理 索…

【JavaEE初阶】TCP/IP协议(二)

文章目录 网络层重点协议IP协议地址管理路由选择 数据链路层重点协议以太网协议MTU 应用层重要协议DNS(域名解析系统) 网络层重点协议 IP协议 协议头格式如下: 4位版本号(version):指定IP协议的版本&am…

2023-6-28-第十一式代理模式

🍿*★,*:.☆( ̄▽ ̄)/$:*.★* 🍿 💥💥💥欢迎来到🤞汤姆🤞的csdn博文💥💥💥 💟💟喜欢的朋友可以关注一下&#xf…

解读 RocketMQ 5.0 全新的高可用设计

作者:斜阳 高可用架构演进背景 在分布式系统中不可避免的会遇到网络故障,机器宕机,磁盘损坏等问题,为了向用户不中断且正确的提供服务,要求系统有一定的冗余与容错能力。RocketMQ 在日志,统计分析&#x…

Selenium系列(二) - 详细解读针对浏览器的操作

控制浏览器有哪些操作? 最大化、最小化浏览器控制、获取浏览器大小获取当前标签页title、url前进、后退、刷新执行js语句打开、关闭新标签页滚动页面 点击右边目录即可跳转哦! -------------->>>>>>>>>> 最大化、最小化…

从零开始 Spring Boot 51:JPA 中的默认列值

从零开始 Spring Boot 51:JPA 中的默认列值 图源:简书 (jianshu.com) JPA 是一个 ORM 框架,因此,通常我们需要在实体类中定义表结构,这其中就包含可能的字段默认值。 本文介绍如何在 Hibernate(JPA&#…

HBase(6):计数操作

1 需求 查看HBase中的ORDER_INFO表,一共有多少条记录。 2 count命令 count命令专门用来统计一个表中有多少条数据。语法: count 表名 注意:这个操作是比较耗时的。在数据量大的这个命令可能会运行很久,真实环境不要使用该命令。…

【从零开始学习JAVA | 第二十五篇】泛型

目录 前言: 泛型: 额外拓展: 总结: 前言: 本文将详细介绍之前我们在JAVA 中一直在讲的泛型,各位感兴趣的同学可以点击进来观看。 泛型: 泛型是一种编程概念,它允许在定义类、接…

文章测试

Markdown示例 本文件的源码是一个markdown文件,也就是说在本工程中直接添加markdown即可嵌入到sphinx文档中。 关于使sphinx支持markdown的详细配置说明,请参考文档markdown-sphinx。 markdown的公式语法在sphinx可能不支持。 以下是markdown的语法使用示例 文…