Demis Hassabis,这位被封为爵士的AI领域的杰出研究者和神经科学家,是否能成为Google的救星?

news2025/1/11 7:09:52

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

当我询问Demis Hassabis是否能拯救Google时,他通过屏幕紧紧地盯着我。在他的家乡英国,已是傍晚时分,而这位DeepMind的创始人正在加班。自从去年夏天吞并了Google Brain后,他所在的这家Google旗下AI研究机构如今领导着公司的全部AI研究工作,面前的任务无比庞大。

Google的核心业务正蓬勃发展,但那似乎与本质无关。Hassabis和我是通过Google Meet交谈,在Gmail安排的采访中,通过Google Calendar安排时间,并通过Google搜索进行研究。主要得益于这些核心产品,Google去年公布了3070亿美元的收入,第四季度增长了13%,股价接近历史最高点。但是,关于其是否能赢得AI竞赛,或者甚至能否胜任竞赛的问题,已经给它最近的成功蒙上了阴影。

“我并不是那样看待的,”Hassabis挑战我的问题的前提。他说,人工智能将“颠覆很多很多事情。当然,你想要站在影响那些颠覆的前沿,而不是处在被动接受的一端。”

Hassabis是那个应该保持Google处于这一前沿的人。这位屡获殊荣的研究员和神经科学家——就在周四被授予爵士称号——领导了一个充满活力的AI团队,该团队负责Google多项突破。自2014年被收购以来,DeepMind已经通过革命性的AI模型攻克了看似不可能的棋类游戏AlphaGo,解码了蛋白质AlphaFold,并为合成数千种新材料奠定了基础。

但现在,Hassabis和合并后的Google DeepMind团队必须将这些类型的突破转化为一个价值1.8万亿美元的公司在日益增长的AI世界中寻求的实质性产品改进。而且他必须在不破坏提供丰厚蓝链接收益的搜索广告业务的情况下完成这一切,AI正威胁着这一业务。

对于聊天机器人的推出延迟,充斥着命名混乱,以及刚刚过去的尴尬图像生成事件,前进的道路不会简单。但Hassabis有机会修正这一切。对于那些认识他、与他共事并且仍然与他共事的人——所有这些人我都为这个故事采访过——Hassabis可能正是这份工作的完美人选。

“我们非常擅长发明新的突破,”Hassabis告诉我。“我认为我们将在未来再次处于做到这一点的前沿。”

从大脑到计算机


Hassabis于1976年7月出生于一个有着华裔新加坡母亲和希腊塞浦路斯父亲的家庭,在北伦敦的童年里,他开始思考AI。作为一个有职业抱负的年轻棋手,Hassabis在11岁时注意到他一直在对抗训练的电子棋盘内部有某种形式的智能,并对这项技术产生了兴趣。“我对这块塑料是如何被编程来下棋的很感兴趣,”他说。“我开始读一些关于它的书并编程我自己的小AI游戏。”

在17岁时共同创造了热门游戏《主题公园》后,Hassabis继续在剑桥大学学习计算机科学,然后在20多岁时回到游戏开发领域。到那时,游戏中的基础AI系统已经变得无处不在,Hassabis决定如果他想在该领域有所作为,就需要理解人类大脑是如何工作的。于是他报名参加了伦敦大学学院的神经科学研究生课程,然后在麻省理工学院和哈佛大学进行博士后研究。

“他非常聪明,而且与我认识的一些其他聪明人不同,”麻省理工学院教授、计算神经科学先驱、Hassabis的博士后导师Tomaso Poggio说。“并不是说他在任何一个领域技术上是魔术师——好吧,也许是棋类游戏——但他对你能谈论的所有事情都非常聪明。而且非常有说服力,毫不费力。”

有一天晚上,Poggio邀请Hassabis共进晚餐,他的学生正酝酿一个新公司的想法,这家公司将利用神经科学的教训来推进AI的发展。他相信,人工大脑可以像人类一样工作。而游戏可以模拟现实世界环境,是理想的训练场。

晚餐后,Poggio问他的妻子是否应该投资Hassabis的新公司,尽管她刚刚见过他,但她告诉他要参与进来。Poggio成为DeepMind最早的投资者之一,尽管他希望自己能给Hassabis更多的资金。“这是件好事。不幸的是,钱不够多,”他说。

在DeepMind的早期,Hassabis通过在游戏模拟中运行AI代理来实现这一愿景。通过这种方式,他帮助推进了强化学习,一种AI训练类型,你让一个机器人在没有任何指令的情况下运行,给予它无数次失败的机会,最终它学会了需要做什么才能赢。

“他们有一个代理在玩所有的Atari游戏,”在DeepMind工作过现在是AI创业公司Common Sense Machines首席执行官的Tejas Kulkarni说。“这是深度强化学习首次证明了自己。就像,哇,这是要去的地方。包括我在内的每个人都涌向那里。”

如果说Atari是前菜,AlphaGo就是主菜。围棋是一个比宇宙中的原子还要多的可玩组合的棋类游戏,正如Hassabis所说,它是AI的“珠穆朗玛峰”。2016年3月,DeepMind的AlphaGo——一个结合了强化学习和深度学习(另一种AI方法)的程序——在七天内以四比一击败了围棋大师李世石。这是AI的一个分水岭时刻,展示了有足够的计算能力和正确的算法,AI可以学习,感知其环境,计划,推理,甚至创造。对于那些参与其中的人来说,这次胜利让人工通用智能——与人类智能相当的AI——首次感觉到触手可及。

“那是纯粹的魔法,”Kulkarni说。“那是人们开始认为,好吧,AGI现在要来了。”

“自DeepMind开始,我们就一直有这个20年计划,”当被问及AGI时,Hassabis说。“我认为我们正处于正确的轨道上,但我觉得那是一个我们知道需要跨越的巨大里程碑。”

进入OpenAI


当DeepMind欢庆之际,一个严峻的挑战在其鼻子底下酝酿。埃隆·马斯克和萨姆·奥特曼在2015年创立了OpenAI,尽管内部充满戏剧,但该组织开始致力于文本生成。

讽刺的是,Google内部的一个突破——称为变换器模型——导致了真正的飞跃。OpenAI使用变换器来构建其GPT模型,最终驱动了ChatGPT。其生成的“大型语言”模型采用了一种称为“自监督学习”的训练形式,专注于预测模式,而不是像AlphaGo那样理解它们的环境。OpenAI的生成模型对它们所处的物理世界一无所知,使它们成为通向人类级智能的可疑路径,但仍然变得非常强大。

根据内部人士的说法,DeepMind并没有足够重视生成模型,也许是因为它们与Hassabis的AGI优先级不一致,与强化学习相距甚远。无论出于何种理由,DeepMind在一个关键领域落后了。

“我们一直在自监督和深度学习上做惊人的前沿工作,”Hassabis告诉我。“但也许是工程和扩展组件——我们本可以更早、更努力地做。显然我们现在完全在做这个。”

前DeepMind工程师Kulkarni认为,当时整个AI领域都不尊重生成模型,简单地没有显示出足够的潜力来证明投资。他说:“有人采取反向押注必须追随那条道路。那就是OpenAI所做的。”

当OpenAI致力于反向押注时,DeepMind及其在Google内部的AI研究对手Google Brain,在沟通上遇到了困难。多位前DeepMind员工告诉我,他们的部门有一种优越感。它还努力将自己与Google母船隔离开来,也许是因为Google的产品焦点可能会分散对更广泛AGI目标的注意力。或许仅仅是因为简单的部落主义。无论如何,在发明了变换器模型之后,Google的两个AI团队并没有立即利用它。

“我因为与Brain合作论文而惹上麻烦,因为想法就像,嗯,你为什么要与Brain合作呢?”一位前DeepMind工程师说。“你为什么不只在DeepMind内部工作呢?”

DeepMind继续推动其核心研究向前发展。2022年7月,其AlphaFold模型预测

了科学已知的几乎所有蛋白质的3D结构。这又是一个重大进步,可能会推动几十年的药物发现。Hassabis告诉我,这是他的标志性项目。

“我们有成千上万的生物学家和科学家从世界各地访问那个数据库,”DeepMind首席商务官Colin Murdoch在Big Technology Podcast采访中说。科学家们正在从事一切从抗生素抗性到疟疾疫苗开发的工作。这是一个巨大的突破。

然后,几个月后,OpenAI发布了ChatGPT。

AI战争与Google的未来


起初,ChatGPT只是一个好奇心。这个OpenAI的聊天机器人在2022年底出现在舞台上,出版物试图理解它的重要性。“ChatGPT是OpenAI对GPT-3的最新修正,”MIT Tech回顾标题消化它的首次亮相。“它很流畅但仍然胡说八道。”

在Google内部,这款产品让人想起了LaMDA,一款公司内部运行的生成式AI聊天机器人——甚至让一名员工相信它是有知觉的——但从未发布。当ChatGPT成为历史上增长最快的消费产品,并且似乎对搜索查询有用时,Google意识到它手上有一个问题。几乎立即,人们开始将它与创新者的困境联系起来。从精神上讲,如果不是从名称上讲,公司内部开始实行“紧急状态”。

Google的和平时期结束了。在新的AI战争中,它的第一大举措是将竞争对手Google Brain和DeepMind团队合并为Google DeepMind,并由Hassabis领导。大型语言模型需要大量的计算来运行和训练,将计算分配给两个AI研究部门将阻碍它们的进展。因此,从这个角度来看,合并是有实际意义的。

按照Hassabis的说法,AI研究和产品也开始碰撞到一个程度,合并它们是合乎逻辑的。是否解决蛋白质折叠可以带来更好的搜索仍然有点不确定,但Hassabis提供了一个值得考虑的论点。他说,构建一个可靠的科学助手,需要解决AI的幻觉问题才能工作。“如果我们在那个领域解决了这个问题,”他说,“我们可以将其引入核心Gemini,然后为聊天机器人和助手解决它。”

“他们就像这样一辆大型半挂车,试图以法拉利的速度移动”

Gemini,Hassabis提到的产品,是Google对OpenAI GPT模型的回应。根据大多数专家的说法,它与OpenAI的技术不相上下。在二月,Hassabis和Google CEO Sundar Pichai宣布了Gemini 1.5,一个大型语言模型,上下文窗口高达100万个标记。这足以处理1小时的视频、11小时的音频或十本书的信息。一个有效的反击。

几乎没有人质疑Google DeepMind生产出色AI模型的能力,但那些接近公司的人士想知道它是否能够穿越Google的官僚机构,将那些研究转化为出色的产品。要成功,Hassabis将不得不说服一个保守的Google产品组织将他的进步推向生产。对于一个极其不愿意推出可能破坏其成功平衡的变化的公司来说,这将不是一件简单的事情。

“他们就像这样一辆大型半挂车,试图以法拉利的速度移动,”在LaMDA上工作过的前Google产品经理Guarav Nemade说。

本月早些时候,当其Gemini图像生成器失控,创造出历史不准确的图像时,包括一些将纳粹描绘成有色人种的图像,Google深切感受到了痛苦。这是一个尴尬的插曲,很大程度上是组织功能失调的产物。

当我询问我的消息来源Hassabis需要做什么才能成功时,几乎所有人都想知道Google是否会给他权限推动公司产品内部的戏剧性甚至痛苦的变化,以推动AI向前发展。Hassabis告诉我,他仍然处于研究方面,没有参加产品会议,但他的工作现在与Google的产品组织密切相关。“我们与产品单位的联系越来越紧密,”他说。“过去几年对于那些技术如何帮助产品功能的头脑风暴需求巨大。”

AI的下一步


随着聊天机器人扩展到超越会话伙伴——成为代表我们采取行动的代理——Hassabis的基础研究有望发挥主导作用。OpenAI已经在开发自主采取行动的代理软件,Hassabis说DeepMind也在这方面做了大量工作。

“我们从一开始就深入代理,对吧?那就是我们所有游戏工作的内容,”他说。“我们相信,代理系统实际上是你需要的智能。”

就像AlphaGo使用Hassabis所钟爱的强化学习来映射其环境一样,AI代理可以使用类似技术来映射我们的世界并自行采取行动。这是比今天的会话模型更大的一步,后者要求用户启动交互,然后才提供信息。当Hassabis谈到这个全方位时刻的可能性时,他眼前一亮。

“我们相信,代理系统实际上是你需要的智能。”

“下一步是让这些系统为你做事情,为你解决问题,预订假期,餐厅,等等。你可以给它们目标,等等,”他说。“我们是做到这一点的专家。”

如果Hassabis完成了任务,他可能会面临新的问题,包括他是否应该管理Google本身,而不仅仅是其AI研究。在这里成功将意味着让Google重新成为AI领导者,考虑到今天的立场,这将是一项壮举。许多认识Hassabis的人希望他成为下一任CEO,并在与我交谈时这样说。但他们可能不得不屏住呼吸。

“我自己还没有听说过,”Hassabis在我提出CEO谈话后说。他立刻指出自己在研究方面有多忙,前面还有多少发明,以及他多么想成为其中的一部分。也许,鉴于局势,这正是Google需要他的地方。“我可以做管理,”他说,“但那不是我的热情。可以这么说。我总是尽量优化研究和科学。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1561415.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Jquery——js库

1. jQuery 基础操作 jQuery 是一个快速、小巧的 JavaScript 库,设计用于简化 HTML 文档的遍历、事件处理、动画设计和 Ajax 交互。jQuery 使用户能够更快地编写 JavaScript 代码,并且能够更容易地处理 HTML 文档、事件、动画和 Ajax。 加载 jQuery 要…

HDLbits 刷题 -- Alwaysblock2

学习: For hardware synthesis, there are two types of always blocks that are relevant: Combinational: always (*)Clocked: always (posedge clk) Clocked always blocks create a blob of combinational logic just like combinational always blocks, but…

【DETR系列目标检测算法代码精讲】01 DETR算法03 Dataloader代码精讲

与一般的Dataloader的区别在于我们对图像进行了随机裁剪,需要进行额外的操作才能将其打包到dataloader里面 这一段的代码如下: if args.distributed:sampler_train DistributedSampler(dataset_train)sampler_val DistributedSampler(dataset_val, shu…

LeetCode-48. 旋转图像【数组 数学 矩阵】

LeetCode-48. 旋转图像【数组 数学 矩阵】 题目描述:解题思路一:一行代码!Python zip函数图一乐【zip函数实现主对角线翻转,[::-1]实现垂直翻转】解题思路二:其实我们也可以先水平轴翻转,让后主对角线翻转。…

Linux之用户账号、用户组和与账号有关的系统文件

目录 一、基本介绍 1.用户和用户组 2.UID和GID 二、 账户管理 1.查看用户的UID和GID 2.添加账户 3.删除账号 4.修改账号 5.账户口令 三、分组管理 1.新增用户组 2.删除用户组 3.修改用户组 4.用户组切换 四、与账号有关的系统文件 1./etc/passwd 2./etc/shado…

LeetCode_33_中等_搜索旋转排序数组

文章目录 1. 题目2. 思路及代码实现详解&#xff08;Python&#xff09;2.1 二分查找 1. 题目 整数数组 n u m s nums nums 按升序排列&#xff0c;数组中的值 互不相同 。 在传递给函数之前&#xff0c; n u m s nums nums 在预先未知的某个下标 k &#xff08; 0 < k…

python_绘图_多条折线图绘制_显示与隐藏

1. 需求 给定一个二维数组 100行, 5列, 每一列绘制一条折线, 横轴为行索引, 纵轴为对应位置的值, 绘制在一个子图里面, 使用python plot, 使用随机颜色进行区别添加显示和隐藏按钮, 可以对每条折线进行显示和隐藏 2. 代码 import numpy as np import matplotlib.pyplot as p…

使用Docker快速搭建Kafka

前言 今天讲下如何使用Docker快速搭建kafka。 前期准备&#xff0c;需要安装好docker、docker-compose。 一、安装Kafka 1、创建Kafka目录&#xff0c;执行如下命令。 mkdir -p /docker/kafka/ cd /docker/kafka/ 2、编写yaml文件&#xff0c;内容如下。 vim docker-com…

国产桌面操作系统统一身份认证及2FA双因子认证安全升级方案

某金融运营服务公司&#xff0c;主要负责业务处理、客户服务、业务监控、报表统计等金融运营服务&#xff0c;为集团下设二级单位&#xff0c;坐落于一线城市&#xff0c;对政策风向有很高的敏锐度。 该公司已为公司业务人员、客户服务、监督员等配备了数百台国产桌面操作系统…

springboot 将manage关闭。

这是SpringBoot自带的接口&#xff0c;会将所有的接口暴露在外面。所以我们上生产环境&#xff0c;需要将这个接口给关闭。 默认是 management.endpoints.web.exposure.include* 只需将配置文件改成下面&#xff0c;Springboot自带的接口就会关闭。 management.endpoints.…

嵌入式系统基础知识(一):嵌入式系统是什么?

一.定义 根据IEEE&#xff08;国际电气和电子工程师协会&#xff09;的定义&#xff0c;嵌入式系统是“控制、监视或者辅助设备、机器和车间运行的装置”。这主要是从应用上加以定义的&#xff0c;从中可看出嵌入式系统是软件和硬件的综合体&#xff0c;还可以涵盖机械等附属装…

vue3使用UEditorPlus 、后端配置、上传图片等处理

前端安装 vue3安装vue-ueditor-wrap // vue-ueditor-wrap v3 仅支持 Vue 3 npm i vue-ueditor-wrap3.x -S // or yarn add vue-ueditor-wrap3.x 下载 UEditorPlus 仓库地址 把dist文件复制到vue3项目中的public下&#xff0c;重命名为UEditorPlus UEditorPlus文档 在main.…

分月饼 java题解

import java.util.Scanner;public class Main {public static void main(String[] args) {Scanner sc new Scanner(System.in); int m sc.nextInt(); // 读取员工数量mint n sc.nextInt(); // 读取月饼数量n// 调用distribute方法并打印返回的分配方法总数//先默认每人分一个…

联手SCQL与CCL,护航隐私计算之路

1.SCQL Overview SCQL&#xff08;Secure Collaborative Query Language&#xff09;是一种专为支持多方安全数据分析而设计的语言&#xff0c;它的目标是在保证数据隐私的前提下&#xff0c;使得不同的参与方能够进行联合数据分析。这一概念和技术是随着隐私计算技术的发展而…

顶顶通呼叫中心中间件-声音编码自适应配置方法(mod_cti基于FreeSWITCH)

顶顶通呼叫中心中间件-声音编码自适应配置方法讲解(mod_cti基于FreeSWITCH) 声音编码自适应介绍 声音编码自适应&#xff0c;通常在语音通信和音频处理领域中指的是一种能够根据信号特性和传输环境自动调整编码参数的技术。其目的是在不同的网络状况和音质要求下&#xff0c;…

3、jvm基础知识(三)

如何判断堆上的对象没有被引用&#xff1f; 常见的有两种判断方法&#xff1a;引用计数法和可达性分析法。 引用计数法会为每个对象维护一个引用计数器&#xff0c;当对象被引用时加1&#xff0c;取消引用时减1。 引用计数法的优点是实现简单&#xff0c;缺点有两点&#xff1…

【浅尝C++】STL第二弹=>迭代器失效详解/vector常用接口使用示例/vector底层结构探索/vector模拟实现代码详解

&#x1f3e0;专栏介绍&#xff1a;浅尝C专栏是用于记录C语法基础、STL及内存剖析等。 &#x1f3af;每日格言&#xff1a;每日努力一点点&#xff0c;技术变化看得见。 文章目录 vector介绍vector常用接口及使用示例构造类函数迭代器的使用容量操作增删改查 迭代器失效详解与v…

ArcGIS支持下SWAT与CENTURY模型的结合:流域水碳氮综合模拟

目录 专题一 流域水碳氮建模 专题二 数据准备 专题三 流域水模拟 专题四 流域氮模拟 专题五 流域碳模拟 专题六 模型结果分析及地图制作 更多应用 基于ArcGIS的SWAT模型是一类比较典型的流域模型&#xff0c;结合SWAT模型和生物地球化学循环模型可以实现流域水碳氮综合模…

通过 Cookie、Session 和 Spring 拦截器技术,实现对用户登录状态的持有和清理(一)

本篇博客对应“2.3 会话管理”小节 视频名称&#xff1a;会话管理 视频链接 什么是HTPP协议&#xff1f; HTTP&#xff0c;Hpyer Text Transfer Protocl&#xff1a;定义了浏览器怎样从&#xff08;万维网客户进程&#xff09;怎样向Web服务器&#xff08;万维网服务器&#…

文献学习-24-用于少发罕见病诊断的动态特征拼接

Dynamic feature splicing for few-shot rare disease diagnosis Authors: Yuanyuan Chen, Xiaoqing Guo , Yongsheng Pan , Yong Xia , Yixuan Yuan Source: Medical Image Analysis 90 (2023) 102959 Keywords: 少样本学习 罕见病诊断 transformer 特征拼接 通道相似度 Ab…