DeepMind的野心与谷歌的收购

前言

瑞典皇家科学院2024年10月9日宣布，将2024年诺贝尔化学奖授予美国华盛顿大学西雅图分校的戴维·贝克（David Baker，又译大卫·贝克），以及谷歌旗下DeepMind公司的戴密斯·哈萨比斯（Demis Hassabis）和约翰·江珀（John M.Jumper），以表彰他们在蛋白质设计和蛋白质结构预测领域作出的贡献。

戴密斯·哈萨比斯从小就是一个“天才”，他一度是世界上排名第二的14岁以下的国际象棋选手，以计算机科学第一名的成绩毕业于剑桥大学，他能掌握大多数思维类的游戏。21岁时，他参加了在伦敦皇家节日大厅举行的“全能脑力”比赛，来自世界各地的选手们挑选五类游戏参与比赛，包括国际象棋、围棋、拼字游戏、双陆棋和扑克，哈萨比斯大获全胜。在接下来的五年里，他又赢了四次，另外那一次，是他没参加。

哈萨比斯是DeepMind的创始人，DeepMind从创立之初就野心勃勃，DeepMind的研究目标是通用人工智能。DeepMind后来被谷歌收购，成为谷歌旗下的一个子公司，DeepMind最引人关注的成果是开发了击败围棋世界冠军李世石和柯杰的AlphaGo。

DeepMind研究通用人工智能，同时也认为通用人工智能是危险的，会成为人类的威胁。所以在谷歌收购DeepMind时，哈萨比斯提了很多前提条件，其中一条是禁止谷歌将任何DeepMind的技术用于军事目的，另一条是要求谷歌设立一个独立的道德委员会，负责监督DeepMind通用人工智能技术的使用，无论该技术什么时候能实现。

在AI普及书籍《深度学习革命》中，对戴密斯·哈萨比斯创立DeepMind以及被谷歌收购的故事进行了详细介绍，内容分享如下。

DeepMind的野心与谷歌的收购

对阿兰·尤斯塔斯而言，收购DNNresearch只是一个开始。作为谷歌的工程主管，他一心想垄断深度学习研究人员的全球市场，或者至少接近这个目标。几个月前，首席执行官拉里·佩奇将此作为优先事项，当时他和谷歌高管团队的其他成员聚集在南太平洋的一座(未披露的) 岛屿上举行战略会议。佩奇告诉他的副手们，深度学习将会改变这个行业，谷歌需要率先到达那里。“让我们真正做大！”他说。尤斯塔斯是会议室里唯一真正知道他在说什么的人。“他们都退缩了，”尤斯塔斯回忆道，“但我没有。”然后，佩奇让尤斯塔斯自由发挥，以确保在这个仍然很小的领域里掌控所有领先的研究人员，这可能需要招募数百名新员工。他已经从多伦多大学带来了辛顿、萨特斯基弗和克里哲夫斯基，现在，在2013年12月的最后几天，他又飞往伦敦去追逐DeepMind。

DeepMind差不多与“谷歌大脑”同时成立，这是一家有着极其崇高的目标的初创公司。公司旨在打造所谓的“通用人工智能”技术，这项技术可以做到人类大脑能做的任何事情，并且会做得更好。这还需要几年、几十年甚至几个世纪的时间，但这家小公司的创始人相信总有一天会实现，就像吴恩达和其他乐观的研究人员一样，他们相信，像多伦多大学这样的实验室所酝酿的很多想法都是强有力的起点。尽管与主要竞争对手相比，DeepMind欠缺雄厚的财力，但它还是会去参与竞拍辛顿的初创公司，并且聚集了可能是世界上最令人印象深刻的年轻的人工智能研究人员，即使与谷歌迅速增长的名单相比也是如此。结果，这个潜在的偷猎者成了其他偷猎者(包括谷歌最大的竞争对手Facebook和微软) 的目标。这给尤斯塔斯的行动增添了一些紧迫感。尤斯塔斯、杰夫·迪恩和另外两名谷歌人计划在伦敦市中心拉塞尔广场附近的DeepMind办公室待上两天，这样他们就可以考察实验室的技术和人才了，他们知道，应该还有一名谷歌人会加入他们：杰夫·辛顿。但是，当尤斯塔斯要求辛顿加入他们的跨大西洋考察之旅时，辛顿礼貌地拒绝了，说自己腰背的状况不允许他出行。他说，航空公司会要求他在飞机起飞和降落时坐下，但他已决定不再坐下了。起初，尤斯塔斯表面上接受了辛顿的拒绝，但他说自己会找到解决办法。

尤斯塔斯不仅仅是一名工程师。他身材修长，腰板笔挺，戴着一副无框眼镜，他还是一名飞行员、跳伞运动员和一个全能型寻求刺激的人，他用制造计算机芯片时的那种冷静、理性来规划每一次新的刺激。当他穿上压力服，从飘浮在地球上方25英里平流层中的气球上一跃而下时，他很快就创造了一项世界纪录。就在最近，他和其他几名跳伞者从一架湾流喷气式飞机上跳伞——一件从未有人做过的事情——这让他产生了一个想法。在他们中的任何一个人跳下之前，必须有人打开飞机后部的门，而为了确保他们在跳跃之前不会翻滚到远处，他们穿上了全身式登山安全带，安全带上有两条长长的黑色带子，挂在机舱内壁的金属环上。尤斯塔斯认定，如果谷歌租一架私人飞机，他们就可以给辛顿套上安全带，把他放在固定于地板的床上，然后用同样的方法把他挂到飞机上。他们就是这么做的。他们乘坐私人湾流飞机到伦敦，辛顿躺在一张由两个座位折叠成的临时床上，两条带子把他固定住。“所有人都对我很满意，”辛顿说，“因为这让他们也可以乘坐私人飞机。”

这架私人飞机的基地位于加州圣何塞，这些飞机经常被谷歌和其他硅谷科技巨头租用，不同的公司使用时，机组人员还会改变机舱内的照明方案，以匹配其企业标志。2013年12月的一个星期天，谷歌的人登机时，灯是蓝色、红色和黄色的。辛顿不确定安全带如何保证他的人身安全，但他觉得这样至少能让他在飞机起飞和降落时不至于在飞机里翻滚，也不至于一头撞上谷歌的同事。那天晚上，他们在伦敦着陆，第二天早上，辛顿走进了DeepMind的办公室。

DeepMind由一群强大的头脑领导。其中两人，戴密斯·哈萨比斯和戴维·西尔弗( David Silver)，相识于在剑桥大学读本科的时候，但他们最初是在西尔弗的家乡、英国东海岸附近举办的一场青年国际象棋锦标赛上相遇的。“在哈萨比斯认识我之前，我就知道他了，”西尔弗说，“我看到他出现在我们镇上，他赢得了比赛，然后离开了。”哈萨比斯的母亲是一位华裔新加坡人，父亲是希腊裔塞浦路斯人，他们在伦敦北部经营着一家玩具店，哈萨比斯一度是世界上排名第二的14岁以下的国际象棋选手，但他的天赋不仅限于国际象棋。他以计算机科学第一名的成绩毕业于剑桥大学，他有办法掌握大多数思维类的游戏。1998年，21岁时，他参加了在伦敦皇家节日大厅举行的“全能脑力”比赛，来自世界各地的选手们挑选五类游戏参与比赛，包括国际象棋、围棋、拼字游戏、双陆棋和扑克，哈萨比斯大获全胜。在接下来的五年里，他又赢了四次，另外那一次，是他没参加。在第二次赢得比赛后，他在网络日记中写道：“尽管脑力运动看起来很高深，但它与其他任何运动一样竞争激烈。在最高级别的比赛中，一切都会发生。辱骂对手、摇晃桌子和各种作弊手段都是比赛的一部分。我过去参加的青年国际象棋锦标赛的桌子下面安装了隔板，以防止参赛者互相踢腿。别被骗了，这就是战争。”杰夫·辛顿后来说，哈萨比斯堪称有史以来最伟大的游戏玩家，然后辛顿尖锐地补充说，他的实力不仅展示在智力上，还展示在他对胜利的极端且坚定不移的渴望上。在“全能脑力”比赛上取得成功之后，哈萨比斯在《外交风云》( Diplomacy) 游戏比赛上赢得了世界团体冠军。这是一款以第一次世界大战前的欧洲为背景的棋盘游戏，在该游戏中，顶尖玩家要依靠国际象棋棋手的分析和战略技巧，同时也需要利用谈判、欺骗和共谋等计策才能走向胜利。“他有三样东西，”辛顿说，“他很聪明，很有竞争性，也非常擅长社交。这是一个危险的技能组合。”

有两件事情让哈萨比斯痴迷。一件是设计电子游戏。在缺席“全能脑力”比赛那年，他帮助著名的英国设计师彼得·莫利纽克斯( Peter Molyneux) 创建了《主题公园》( Theme Park) 游戏,在这款游戏里，玩家们建造并运营一个巨大的数字模拟摩天轮与过山车游乐园。这款游戏的销量估计有1000万份，它激发了一种重新创造大量物理世界的全新游戏类型——模拟游戏。另一件让哈萨比斯痴迷的事是人工智能。他相信自己有一天会创造出一台可以模仿大脑的机器。在接下来的几年里，随着他创立起DeepMind，这两件令他痴迷的事让人难以预料地融合在了一起。

在剑桥大学本科生戴维·西尔弗身上，哈萨比斯找到了一种志趣相投的感觉。大学毕业后，他们两人创立了一家名为Elixir的电子游戏公司。哈萨比斯在伦敦发展这家公司的过程中，一直在网上记录着公司内外的生活(大部分是公司内部的)。这是一种宣传手段，由他的一位设计师代笔，这种方式引起了人们对他的公司及其游戏的兴趣。但他在某些地方非常诚实，展示了自己的极客魅力、足智多谋和钢铁般坚定的必胜决心。有一次，他记录了自己与英国知名的游戏发行商Eidos的会面情况，Eidos同意发行Elixir的第一款游戏。哈萨比斯说，对一家游戏开发商来说，与发行商建立深厚的信任感是至关重要的，他觉得在伦敦办公室里的这次长谈会面取得了成功。但是当会议结束时，Eidos的董事会主席——伊恩·利文斯通(Ian Livingstone), 一个后来因为行业贡献而被授予大英帝国司令勋章的人——注意到会议室里有一张桌上足球台，他向哈萨比斯提出挑战。哈萨比斯思考了一下他是否应该输掉这场比赛，以便让他的发行商感到开心，然后得出结论：除了赢下来，他别无选择。哈萨比斯说：“伊恩不是一个普通的玩家，有传言说，他曾和史蒂夫·杰克逊( Steve Jackson) 一起获得过赫尔大学的双人冠军。这把我置于一个可怕的境地。成为Eidos董事会主席的手下败将(面对出色的球技)意味着获得一张门票。不过，你得在某个地方划清界限。毕竟，游戏就是游戏。我以6：3的比分获胜。”
他的日记似乎不局限于Elixir公司，也涉及他的下一次创业。启动第一次创业时，他坐在家里的长椅上，听着科幻电影《银翼杀手》( Blade Runner)的配乐(第十二首,《雨中泪水独白》, 单曲循环)。正如斯坦利·库布里克在20世纪60年代末启发了年轻的杨立昆一样, 雷德利·斯科特( Ridley Scott) 在20世纪80年代初用这部现代科幻经典抓住了年轻的哈萨比斯的想象力。在这部经典影片中，一位科学家和他专横的公司制造了一些行为像人类的机器。随着规模较小的游戏开发商被挤出市场，哈萨比斯关闭了Elixir，并决定创建另一家公司。他认为，新公司将会比上一家更加野心勃勃，回到他在计算机科学和科幻小说的根本上。2005年，他下定决心创建一家能够再造人类智能的公司。

他知道自己离迈出第一小步还差好几年时间。在实际创办一家公司之前，他在伦敦大学学院攻读了神经科学博士学位，希望在再造大脑之前更好地了解大脑。“我在学术界的逗留总是暂时的。”他说。戴维·西尔弗也回到了学术界，但不是作为神经科学家。⁸他在加拿大阿尔伯塔大学进入了一个相邻的领域——人工智能。在重新走到一起创办DeepMind之前，他们两人在研究领域上的差异表明了神经科学与人工智能之间的关系，至少这些年推动人工智能实现巨大变化的很多研究人员都是这么看的。没有人能真正理解大脑，也没有人能再造它，但有些人相信这两种努力最终会相互带动。哈萨比斯称之为“一种良性的循环”。

在伦敦大学学院，哈萨比斯探索的是大脑中记忆与想象的交集。在一篇论文中，他研究了一些大脑受损后出现遗忘症、无法记住过去的人，他发现这些人在想象自己处于新环境时也很困难，比如去购物中心或去海滩度假。识别、存储和回忆图像在某种程度上与创造图像有关联。2007年，世界领先的学术期刊《科学》提名这项研究成果为年度十大科学突破之一。但这只是另一块垫脚石而已。在获得博士学位之后，哈萨比斯开始在伦敦大学学院实验室的盖茨比计算神经科学中心做博士后研究，该研究中心聚焦于神经科学和人工智能的交会处，由英国超市巨头戴维·塞恩斯伯里( David Sainsbury) 资助, 创始教授是杰夫·辛顿。

在创办仅仅三年之后，辛顿就离开了这个职位，回到多伦多大学担任教授，而哈萨比斯那时还在经营他的游戏公司。几年之后，他们才终于相遇，但也仅仅是匆匆一见。哈萨比斯与盖茨比中心的一位研究人员沙恩·莱格(Shane Legg) 达成了共识。正如他后来回忆的那样，当时通用人工智能并不是严肃的科学家们公开讨论的内容，即使在盖茨比中心这样的地方。“这基本上是一个被人耻笑的领域，”他说，“如果你跟任何人谈论通用人工智能，最好的情况是别人认为你很古怪，最坏的情况是别人认为你具有某种妄想的、非科学的特征。”但莱格是新西兰人，他曾一边练习芭蕾，一边学习计算机科学和数学，他和哈萨比斯有着同样的见解。他梦想打造“超级智能”，一种可以超越大脑能力的技术，尽管他担心这些机器有一天会危及人类的未来。他在论文中说，超级智能可以带来前所未有的财富和机会，或者导致威胁人类生存的“噩梦场景”。他认为，即使打造出超级智能的可能性微乎其微，研究人员也必须考虑可能的后果。“一个人如果认同，真正的智能机器的影响可能是深远的，并且在可预见的未来至少有很小的概率会发生这种情况，那么他就需要谨慎地提前做好准备。如果到了智能机器短期内很有可能出现的时候，我们再来深入讨论和思考所涉及的问题，那就太晚了，”他写道，“我们现在就需要认真对待这些事情。”他更大的信念是，大脑本身将为构建超级智能提供一张地图，这就是他来到盖茨比中心的原因。“那里似乎是一个非常自然的去处。”他说。在那里，他可以探索他所谓的“大脑和机器学习之间的联系”。

多年之后，杰夫·辛顿描述沙恩·莱格时，将他与戴密斯·哈萨比斯做了对比：“他不那么聪明，不那么好胜，也不那么擅长社交。但是，几乎所有人都是这样的。”即便如此，在接下来的几年里，莱格的想法几乎与他更知名的搭档的想法具有同样的影响力。

哈萨比斯和莱格有着同样的野心。用他们自己的话来说，他们想“解决智能问题”。但是，在最佳实现方式上，他们意见不一。莱格建议他们从学术界开始，而哈萨比斯说，他们别无选择，只能进入产业界，他坚持认为，要获得必要的资源来面对如此极端的任务，这是唯一的方法。哈萨比斯了解学术界，在Elixir创业了一段时间后，他也了解了商业世界。他不想为了创业而创业。他想创建一家公司，以便为他们希望促进的长期研究做好独特的准备。他告诉莱格，他们可以从风险投资机构那里融资，其金额要超过教授写资助申请所获得的资金。另外，他们能够以大学无法实现的速度搭建好必要的硬件。莱格最终同意了。“我们实际上没有将计划告诉盖茨比中心的其他任何人，”哈萨比斯说，“他们会认为我们有点儿疯狂。”

在博士后阶段，他们开始与一位名叫穆斯塔法·苏莱曼(Mustafa Suleyman) 的创业者和社会活动家待在一起。当他们三人决定成立DeepMind时，苏莱曼提供财务构思，负责创造公司的收入以维持研究所需。他们在2010年秋天推出了DeepMind，它的名字是对深度学习和神经科学的认可，也是对英国科幻小说《银河系搭车客指南》中计算生命终极问题的超级计算机“沉思”( Deep Thought) 的致敬。对于一家着眼于人工智能领域且致力于在近期解决问题的公司，哈萨比斯、莱格和苏莱曼拥有各自独特的观点，他们也公开对这项技术在现在和未来的危险性表示关注。公司的既定目标——写在商业计划书的第一行——是通用人工智能。但与此同时，他们也告诉任何愿意倾听的人，包括潜在的投资人：这项研究可能很危险。他们说永远不会与军方共享自己的技术，并且警告说超级智能可能会成为一种生存威胁，这一点与莱格论文中的观点相呼应。

在公司成立之前，他们就接触了DeepMind最重要的投资人。最近几年，莱格参加了一个名为奇点峰会的未来学家年度会议。“奇点”是一个理论时刻，此时技术已经进步到了人类无法控制的地步。这个小型会议的创始人们属于一个由边缘学者、创业者和追随者组成的不拘一格的团体，他们相信这一时刻即将到来。他们不仅致力于探索人工智能，还关注生命延长技术、干细胞研究和其他不同的未来主义。其中一位创始人名叫埃利泽·尤德考斯基(Eliezer Yudkowsky), 他是自学成才的哲学家, 并且自称人工智能研究人员，他在21世纪第一个十年的早期向莱格介绍了超级智能的概念，当时他们在与一家总部位于纽约的初创公司Intelligensis合作。但是，哈萨比斯和莱格把目光投向了会议的另一位创始人: 彼得·蒂尔(Peter Thiel )。

2010年夏天，哈萨比斯和莱格计划在奇点峰会上发表演讲，他们知道每位演讲者都会被邀请到蒂尔位于旧金山的别墅参加私人聚会。蒂尔是网络支付服务商贝宝(PayPal) 的创始成员之一, 后来他作为Facebook、LinkedIn (领英) 和Airbnb(爱彼迎)的早期投资人，获得了更大的声誉和更多的财富。哈萨比斯和莱格觉得，他们如果能进入蒂尔的别墅，就有机会向他推销自己的公司，并游说他参与投资。蒂尔不仅有钱，还有意愿。他是一个相信极端想法的人，甚至比典型的硅谷风险投资家更相信极端想法。毕竟，他在资助奇点峰会。在未来的几年里，与硅谷的很多巨头不同，他全力支持特朗普，在2016年美国总统选举之前及之后都是如此。“我们需要一个疯狂到足以投资一家通用人工智能公司的人，”莱格说，“他是一个具有深度逆向思维的人——针对所有的事情。这个领域的大多数人都不认同我们所做的事情，所以他的深度逆向思维很可能会对我们有利。”

会议在旧金山市中心的一家酒店里召开，哈萨比斯在第一天发表了一场演讲，他认为，打造人工智能的最佳方式是模仿人类大脑的工作方式。当工程师按照大脑的形象设计技术时，他称之为“生物方法”，无论是神经网络还是其他数字化创新，都是如此。“我们应该专注于大脑的算法水平，”他说，“提取大脑在解决问题时的那种表征和算法，而这些问题是我们想要通用人工智能来解决的。”这是定义DeepMind 的核心支柱之一。第二天，沙恩·莱格用自己的演讲描述了另一个核心支柱。他告诉听众，人工智能研究人员需要明确的方法来跟踪自己的进展。否则，他们无法知道自己什么时候走上了正确的道路。“我想知道我们要去哪里，”他说，“我们需要一个关于什么是智能的概念，需要一种衡量它的方法。”哈萨比斯和莱格不仅仅是在描述他们的新公司将如何运作。最重要的是，他们的演讲是一种接近蒂尔的方式。

蒂尔的别墅坐落在贝克街，隔着一个淡水湖与旧金山艺术宫遥望，旧金山艺术宫是约100年前为了一场艺术展而建造的一座石头城堡。当哈萨比斯和莱格穿过前门走进客厅时，迎接他们的是一副棋盘。每颗棋子都摆在自己的位置上，白棋与黑棋对垒，等待有人来下棋。他们先见到了尤德考斯基，尤德考斯基将他们介绍给了蒂尔。但他们没有推销自己的公司——至少没有马上推销。哈萨比斯开始谈论国际象棋。他告诉蒂尔，他也是一名棋手，他们讨论了这种古老游戏的持久力量。哈萨比斯说，它延续了这么多个世纪，是因为马和象之间的紧张关系，及其在技能和弱点上的拉锯战。蒂尔被迷住了，邀请他们两人第二天再来，这样他们就可以推销自己的公司了。

当他们第二天早上回来时，蒂尔穿着短裤和T恤，刚刚结束日常锻炼，大汗淋漓。他们坐到餐桌前，一名管家给他拿来了一杯可乐。哈萨比斯开始推销，他说自己不仅仅是一名游戏玩家，还是一位神经科学家，他们正在按照人脑的形象打造通用人工智能，并且将从学会玩游戏的系统开始进行漫长的探索，全球计算能力的持续指数级增长将推动他们的技术达到更高的水平。对于这次推销，连彼得·蒂尔都感到惊讶。“这件事可能有点儿大。”他说。但他们一直在交谈，在接下来的几周里，沟通仍在继续，蒂尔和他的风险投资机构——创始人基金(Founders Fund) 的几位合伙人都参加了。最后，他主要的反对意见不在于公司的野心过大，而在于公司的总部设在伦敦。这让他关注被投公司更困难一些，这也是硅谷风险投资家的典型担忧。尽管如此，他还是在DeepMind第一轮200万英镑的种子投资中投了140万英镑。在接下来的几个月和几年里，其他知名投资人也加入进来，包括埃隆·马斯克，这位硅谷的大亨在创建火箭公司SpaceX和电动汽车公司特斯拉之前，曾与蒂尔一起创立了贝宝公司。“投资有一个特定的圈子，”莱格说，“他是决定参与投资的亿万富翁之一。”

DeepMind的雪球就此滚动起来。哈萨比斯和莱格聘请了辛顿和杨立昆担任技术顾问，这家初创公司很快招募了该领域的很多后起之秀：弗拉德·姆尼，他曾在多伦多大学辛顿门下学习；科拉伊·卡武库奥格鲁，他是一位出生于土耳其的研究人员，曾在纽约大学杨立昆手下工作；亚历克斯·格雷夫斯，他在跟随辛顿从事博士后研究之前，在瑞士是于尔根·施米德胡贝的学生。他们告诉彼得·蒂尔，学习玩游戏是起点。自20世纪50年代以来，游戏一直是人工智能的试验场，当时的计算机科学家制造了第一个自动化棋手。1990年，研究人员打造了一台名叫奇努克( Chinook)的机器，它击败了世界上最好的跳棋选手，这是一个转折点。7年之后，IBM的“深蓝”超级计算机超越了国际象棋特级大师加里·卡斯帕罗夫( Garry Kasparov)。2011年，另一台IBM机器“沃森”超越了《危险边缘》游戏的所有赢家！现在，由弗拉德·姆尼领导的一组DeepMind研究人员开始开发一个系统，玩家基于此系统可以玩雅达利的老游戏，包括20世纪80年代的经典游戏，如《太空入侵者》(Space Invaders)、《乒乓》(Pong) 和《越狱》(Breakout)。哈萨比斯和莱格坚持认为，在人工智能的开发过程中，研究人员应该密切评估其进展，原因之一是这有助于深入关注其中的危险。这些游戏提供了这种评估标准。分数是绝对的，结果是确定的。“这就是我们插下旗子并攻下山头的方式，”哈萨比斯说，“接下来我们应该去哪里? 下一座珠穆朗玛峰在哪里? ”另外，玩游戏的人工智能提供了一种非常好的演示。演示可以促进软件销售，有时也可以促进公司的出售。在2013年初，这一点是显而易见的，甚至是不可否认的。

在《越狱》游戏中，玩家用一个小球拍将球弹向一堵彩砖墙。当球击中一块砖时，它会消掉，玩家就赢得了几分。但是，如果球拍漏掉球的次数太多，比赛就结束了。在DeepMind，姆尼和他的同事们打造了一个深度神经网络，它通过反复试错来学习《越狱》的细微差别，玩了成千上万局游戏，同时密切跟踪哪些动作有效、哪些无效，这种技术被称为“强化学习”。这个神经网络可以在两个多小时内掌握这款游戏。在最开始的30分钟内，它学会了基本概念——朝着球移动、将球击向砖块——尽管它还没有掌握游戏。一个小时之后，它变得足够熟练了，每次都能击中球，每次命中都能得分。两个小时之后，它学会了一个控制游戏的技巧，即将球击到彩砖墙后面去，使它落入一个狭小空间，在那里，它几乎可以无休止地反弹，一块接一块地击中砖块，一点一点地得分，而且永远不会弹回球拍。最终，该系统玩游戏的速度和精度超越了所有人类玩家。

在姆尼和他的团队打造了这个系统之后不久，DeepMind给公司的投资方创始人基金的投资人，包括一个名叫卢克·诺塞克(Luke Nosek) 的人，发送了一段视频。诺塞克最初是与彼得·蒂尔和埃隆·马斯克一起作为贝宝公司的创始团队成员而声名鹊起的, 他们就是所谓的“贝宝黑帮”(PayPal Mafia)。在收到DeepMind的雅达利游戏人工智能视频之后不久，正如诺塞克后来对一位同事所说的那样，他和马斯克在一架私人飞机上，当他们观看视频并讨论DeepMind时，另一位碰巧在飞机上的硅谷亿万富翁拉里·佩奇无意中听到了他们的对话。佩奇就这样了解到了DeepMind，并引发了一场追逐，这场追逐最终以谷歌一行人乘坐湾流飞机前往伦敦而告终。佩奇想收购这家初创公司，即使在如此早期的阶段。但哈萨比斯感到不太确定，他一直打算创建属于自己的公司，至少他对员工是这么说的。他说DeepMind将在未来20年甚至更长时间内保持独立。

辛顿和其他谷歌人乘电梯去DeepMind办公室，却被困在两层楼之间。在他们等待的时候，辛顿担心迟到会让DeepMind的人感觉不佳，其中很多人他都认识。“这一定很尴尬。”他想。当电梯终于重新启动，这些谷歌人到达顶层时，他们受到了哈萨比斯的迎接，哈萨比斯把他们带进了一间会议室，里面有一张长长的会议桌。他并没有表现出尴尬，只是有些紧张，他担心将实验室的研究暴露给一家公司，而这家公司拥有超级强大的资源，能够以他自己的实验室永远无法实施的方式加速这项研究。他不想暴露公司的秘密，除非他确定自己想出售公司，同时谷歌愿意收购。在谷歌人进入房间后，他开始讲话，介绍了DeepMind的使命。随后，几位 DeepMind研究人员透露了实验室正在研究的部分内容，从具体的到理论的。与钱相关的部分由弗拉德·姆尼来介绍，跟往常一样，这指的是《越狱》。

当姆尼介绍这个项目时，筋疲力尽的杰夫·辛顿躺在地板上，其他人坐在旁边的桌子旁。偶尔，当辛顿想提问时，姆尼会看到他把手举了起来。姆尼想，这就像他们在多伦多大学的日子一样。演示结束时，杰夫·迪恩问，系统是否真的在学习《越狱》的技能。姆尼说是的，它在自动寻找一些特定的策略，因为这些策略赢得了最多的奖励——在这种情况下，指的是最高的分数。这项强化学习技术并不是谷歌正在探索的，但它是DeepMind内部的一个主要研究领域。沙恩·莱格在他的博士后导师发表了一篇论文后接受了这个概念，该论文认为大脑的工作方式与此基本相同。DeepMind已经招募了很多专门研究这个想法的研究人员，包括戴维·西尔弗。阿兰·尤斯塔斯认为，强化学习让DeepMind构建了一个系统，这是在通用人工智能方面的第一次真正尝试。“系统在大约一半的比赛中有超人的表现，在有些情况下，表现令人震惊，”他说，“这台机器会制定出一个撒手锏般的策略。”

雅达利游戏演示结束之后，沙恩·莱格根据他的博士论文做了一场演讲，描述了一种可以在任何环境中学习新任务的数学智能体。弗拉德·姆尼和他的团队已经打造出了一些智能体，它们可以在《越狱》和《太空入侵者》等游戏中学习新的行为。莱格提出的是这项工作的延伸——超越游戏并进入更为复杂的数字领域以及现实世界。就像软件智能体可以学习通关《越狱》一样，机器人可以学习在客厅里行走，汽车可以学习在社区里导航。或者，以大致相同的方式，这些智能体中的一个可以学习掌握英语。这些问题都要困难得多。游戏是一个封闭的宇宙，其中的奖励机制是明确定义的，有积分和终点线。而现实世界要复杂得多，奖励机制更难以定义，但这是DeepMind为自己规划的路线。尤斯塔斯说：“沙恩·莱格的论文构成了他们所做的事情的核心。”

这是一个遥远的未来目标，但是在这个过程中，会有很多小的步骤，这些步骤会在不久的将来形成实际的应用。在谷歌人的注视下，在苏格兰长大、父母都是美国人的亚历克斯·格雷夫斯展示了其中的一个应用：可手写的系统。通过分析定义物体的模式，神经网络就可以学会识别它。如果系统能理解这些模式，那么系统也可以生成该物体的图像。在分析了一组手写单词后，格雷夫斯的系统就可以生成手写单词的图像。他们希望，通过分析小狗和小猫的照片，这种技术也能生成小狗和小猫的图像。研究人员称之为“生成模型”，这也是DeepMind研究的一个重要领域。

当谷歌在全世界范围给每位研究人员支付几十万美元(如果不到数百万美元) 薪酬时，对于亚历克斯·格雷夫斯这样的人，DeepMind每年支付的薪酬不到10万美元，这是公司所能承受的。这家小公司在成立三年之后，仍然没有产生收入。苏莱曼和他的团队正在试图开发一款移动应用程序，通过人工智能来帮助用户筛选出最新款的时装——时尚编辑和作家偶尔会在人工智能研究人员的陪同下来到拉塞尔广场的办公室，还有一个单独的小组即将在苹果应用商店上线一款新的人工智能电子游戏，但尚未产生收入。当格雷夫斯和其他研究人员向来自谷歌的访问者描述自己的工作时，哈萨比斯知道，有些事情必须改变了。

演示结束后，杰夫·迪恩问哈萨比斯是否可以看一下公司的计算机代码。哈萨比斯起初犹豫不决，但随后同意了，迪恩坐在一台机器旁，旁边是科拉伊·卡武库奥格鲁，他是Torch(该公司用来构建和训练其机器学习模型的软件)的负责人。看了大约15分钟的代码之后，迪恩就知道DeepMind能与谷歌匹配。“很显然，这是由那些知道自己在做什么的人做出来的，”他说，“我觉得，他们的文化与我们的文化是兼容的。”至此，毫无疑问谷歌将收购这间伦敦实验室。马克·扎克伯格和Facebook最近加入了与谷歌、微软和百度的竞争，以获得这类人才，谷歌下定决心要保持自己的领先地位。尽管哈萨比斯早就向员工承诺DeepMind将保持独立，但他现在别无选择，只能出售。如果不卖，公司就会死掉。莱格说：“这些市值千亿美元的企业不顾一切地招募我们所有的顶尖人才，这让我们无法承受。我们设法留住所有人，但是从长远来看，这是不可持续的。”

尽管如此，在把DeepMind出售给谷歌的谈判过程中，他们至少争取到了哈萨比斯对其员工所做的部分承诺。DeepMind保持独立的时间不会超过三周了，更不用提20年的事情，但哈萨比斯、莱格以及苏莱曼坚持要求，他们与谷歌的协议中要包括两个条件，以维护他们的理想。其中一条是禁止谷歌将任何DeepMind的技术用于军事目的，另一条是要求谷歌设立一个独立的道德委员会，负责监督DeepMind通用人工智能技术的使用，无论该技术什么时候能实现。一些了解协议的人质疑这些条款是否有必要，在随后的几年里，很多人工智能圈子里的人认为这只是一个噱头，旨在提高DeepMind的出售价格。“如果他们说自己的技术是危险的，其技术似乎就显得更强大，他们就可以要求更高的对价。”有人这么说。但是，DeepMind 的创始人坚称，除非这些要求得到满足，否则不会出售公司，他们将继续为相同的理想而奋斗，直到最后。

在加利福尼亚州登上湾流飞机之前，辛顿曾说他将乘火车回加拿大——这是一个为了保护其伦敦之行秘密的封面故事。在返程的航班上，飞机绕了一小段航程去加拿大让他下飞机，降落在多伦多的时间就是他如果乘火车大约应该到达的时间。这个计策如约实施。1月，谷歌宣布以6.5亿美元收购了一家拥有50名员工的公司——DeepMind，这是该公司另一件大功告成的事。Facebook也参与竞拍了这间伦敦实验室, 而每位DeepMind创始人可以从Facebook套现的金额是从谷歌套现金额的两倍。

如果需要《深度学习革命》电子书，V联系我，我发给你。