Ilya Sutskever:师从Hinton,“驱逐”奥特曼,一个改变AI世界的天才科学

news2024/9/30 7:24:01

ChatGPT 已经在全球爆火,但大众在两周之前似乎更熟悉Sam Altman,而对另一位创始人 Ilya Sutskever 却了解不多。

直到前几天因为OpenA眼花缭乱的政权争夺大戏,OpenAI 的首席科学家Ilya Sutskever的名字逐渐被世人所知。

Ilya Sutskever在科学和工程实现上为ChatGPT的诞生做出了巨大贡献,可谓是ChatGPT的发明人。然而,也许是因为Sam Altman是负责搞融资和商业化的CEO,也许是因为 Altman 的名字总是被国内媒体翻译为“奥特曼”,他的激进的作风更能引起国内社交媒体的关注,这使得Altman被冠上了“ChatGPT之父”的称号。

那么究竟谁才是真正的ChatGPT之父呢?知乎上有网友专门为此展开了争论。

这里暂且放下争论,其实少了Ilya Sutskever和Sam Altman任何一人,都没有现如今的 ChatGPT 和OpenAI,但如果没有Ilya Sutskever在AI领域中的诸多突破与成就,一定不会有现在ChatGPT 的出现。

今天,我们先不谈“Altman”,而是着重回顾 Ilya Sutskever 的故事。看看他是如何凭借着他的聪明才华一步步从普通人成为 AI 界的一代传奇人物!

▲Ilya Sutskever 手绘像,来源为 JourneyMatters

1986—2002年:早年生活和教育

Ilya 于 1986 年出生在苏联,5 岁时搬到耶路撒冷生活,自幼对计算机产生浓厚兴趣,从 7 岁时就开始自学编程。之后,在以色列开放大学学习了一段时间后,16 岁那年再次搬家去了加拿大,转而在多伦多大学读书,据说他在新家的第一件事就是去多伦多公共图书馆找一本关于机器学习的书。

从那时起,Ilya 对人工智能的热情日益加深,他决定将构建通用人工智能(AGI)设定为自己的主要目标

大模型研究测试传送门

GPT-4传送门(免墙,可直接测试,遇浏览器警告点高级/继续访问即可):
http://hujiaoai.cn

2003年:拜入深度学习之父Hiton门下

在学术生涯中,**对 Ilya 影响最大的人莫过于他的老师:Geoffrey Hinton——被誉为深度学习之父的那个男人。

2003年,还在就读本科的 Ilya 每天都会敲Hinton的门,希望能被接纳进实验室。在读了几篇论文后,他在深度学习领域的思考与 Hinton 教授的思想发生了碰撞,引起了 Hinton 教授对 Ilya 独特之处的认识:他有能力发现那些其他人可能需要数年才能发现的东西。

尽管当时正值人工智能领域的寒冬,研究者们对人工智能的兴趣逐渐下降,但 Hinton 教授还是决定接纳Ilya进入他的实验室。

2005 年,Ilya 在多伦多大学获得数学学士学位,2007 年获得计算机科学硕士学位,2013 年获得计算机科学博士学位。

2012年:图像识别领域的革命—— AlexNet

或许你听说过 AlexNet 与 Hiton或 Alex的关系,但你可能没有注意到它与Ilya之间也有着关联。

当时正值人工智能的低谷期,Hinton 的神经网络理念并没有被同期的 AI 研究者们广泛接受,这让他们面临了巨大的压力。然而,他们并没有因此而退缩,反而更加坚定了他们的信念。

2012 年,ImageNet 大赛为他们提供了证明自己的机会——看谁能设计出最优秀的图像识别算法,成功识别出更多的图像。

Hinton带着他的两位学生 Ilya Sutskever 和 Alex Krizhevsky 在这次大赛中发明了AlexNet,他们摒弃了传统的手工设计解决方案,而是使用了深度神经网络并在 GPU 上训练它们

从左到右:IIya Sutskever、Alex Krizhevsky、Geoffrey Hinton

AlexNet 突破了75% 的准确度,远远超越了所有竞争对手,向大家展示了深度学习的巨大潜力,也标志着深度学习革命的开端。

由他们三人共同撰写的 AlexNet 论文至今引用量已超过 6 万次,成为计算机科学领域引用最多的论文之一,而当时的 Ilya 才只有 26 岁。

2013年:从 DNNResearch 到加入谷歌

在这场竞赛后,三人共同创办了一家名为 DNNResearch 的公司,然而,该公司并没有推出任何产品,也没有明确的发展计划。随后,包括百度、谷歌、微软和 DeepMind 在内的四家公司参与了竞标收购。仅仅过去了4个月,谷歌在 2013 年 3 月以 4400 万美元的金额收购了 DNNResearch,并聘请 Ilya 担任 Google Brain 的研究科学家。

在 Google Brain 工作期间,Ilya 参与了许多后来惊艳世人的工作,比如与 Demis Hassabis 和 David Silver 等人共事,参与AlphaGo的核心工作。

此外,他还积极参与了 TensorFlow 的开发,造福了众多深度学习研究人员。

曾一起共事的同事称,“Ilya 是个无所畏惧的人。”

在这个阶段,Ilya 的愿景变得更加宏大——开始坚信通用人工智能(AGI)近在咫尺。

2014年:机器翻译的革命—— Sequence-to-Sequence

在谷歌工作期间,Ilya 发明了一种用于将英语翻译成法语的变体神经网络。他提出的序列到序列学习方法捕捉输入的时序结构(如英语句子)并将其映射到具有时序结构的输出(如法语句子)。

当时的研究者们并不相信神经网络能够进行翻译工作,而他的发明击败了表现最佳的翻译器,并促使谷歌翻译重大升级,让机器翻译领域从此焕然一新,也自此引起了自然语言领域的研究新热潮。

没错,这背后的就是序列到序列学习(Sequence-to-Sequence Learning)算法。

这对后来Transformer 的诞生也做出了重要贡献。

2015年:联合创建OpenAI,开启新篇章

谷歌在 AI 领域一直处于领先地位,而 Ilya 作为备受重视的研究人员,有天收到了一封来自 Sam Altman 的邀约。他赴约去与 Sam Altman、Greg Brockman 和 Elon Musk 等人共同讨论人工智能的未来,畅想未来可能发生的事情,以及他们是否能够采取一些积极措施来影响人工智能的发展。

就在这场聚会中,OpenAI 的创始理念首次被明确提出——“利用人工智能造福全人类,并以负责任的方式推动人工智能的发展”,这激发了所有参与者的期待和激情。然而,当时 Ilya 还在谷歌工作,对于是否加入 OpenAI 的问题犹豫不决。最终,在多次思考和马斯克等人的劝说下,Ilya 决定放弃在谷歌数百万美元的工作机会,成为非营利组织 OpenAI 的联合创始人,并担任研究总监。

▲Sam Altman 与 Ilya Sutskever

OpenAI 的早期发展并不顺利,作为非营利组织,寻找投资人成为一项艰巨的任务。然而,马斯克等人决定向该项目投入 10 亿美元,这使得 OpenAI 能够聘用领域内的优秀人才,并取得了一些重要突破。但是这些发展也付出了昂贵代价——每个月需要在云计算上花费数百万美元,而且还需要从其最大的竞争对手谷歌那里租用计算能力。

马斯克曾是OpenAI 的董事会成员,在 2018 年因与特斯拉发生利益冲突而选择离开,这一度使得 OpenAI 面临严重的资金问题。在如此困境下,Sam 试图利用他的人脉寻找新投资者,但由于 OpenAI 是个非营利组织,需要的资金过多,几番尝试并未成功。他们必须迅速找到解决方案,否则所有努力都将付诸东流。

在这个关键时刻,微软的 CEO 同意与他们会面,会议结果改变了 OpenAI 的窘境。Sam 成功说服了微软投资 10 亿美元,并获得了使用 Azure 云计算平台的权限。这样,OpenAI 就不再需要向谷歌支付费用,而微软转而成为他们的重要合作伙伴。

2018-2020:GPT-1~3 的发展

GPT 模型的每一次迭代都代表了自然语言处理领域的重大进展:

  • GPT-1(2018):这是该系列的首个模型。其关键创新之一是采用了无监督的预训练方法,经过对大规模互联网文本数据集的训练,通过学习根据前面的单词上下文来预测句子中的单词,使模型能够深入理解语言结构并生成类似于人类的文本。

  • GPT-2(2019):在 GPT-1 的成功基础上构建,采用更大的数据集训练,生成更为强大的模型。GPT-2 的一项重大进展是其能够在各种主题上生成连贯而流畅的段落文本,使其成为无监督语言理解和生成任务中的关键参与者。

  • GPT-3(2020):在规模和性能上都取得了显著突破。GPT-3 拥有当时震惊世人的 1750 亿参数,在众多语言任务上取得了最先进的性能,在问答、机器翻译和摘要生成等能力上可以媲美人类水平。此外,它还展示了执行简单编码任务、撰写连贯新闻文章甚至是诗歌的能力。

▲GPT 架构

在微软的支持和 Ilya 等人的领导下,OpenAI 的研究人员在 2018 年创建了原始的 GPT 模型。一年后,他们又发布了 GPT-2,这个新模型展示了大型语言模型的巨大潜力,但同时也引发了 AI 社区的不满,因为 OpenAI 不再是一个非营利实体,而且开源作品越来越少。

然而,尽管面临争议,OpenAI 仍取得了显著的研究成果。2020 年,他们发布了GPT-3,使得OpenAI到达一个重要转折点。尽管 GPT-3 的性能出色,但它并没有引起太多关注。为了让更多的人能够使用 GPT-3,Sam 说服了另外两位创始人,提出了用户友好界面的想法。

2021年: 对 DALL-E 1 的研究

Ilya 总是走在创新前沿,2020 年 6 月,OpenAI 提出了新概念—— Image GPT,旨在利用神经网络依据用户的文本指令生成新的高质量图片,而 DALL-E 便是实现了该想法的杰作。

在 Ilya 的领导下,OpenAI 团队创造出了由AI驱动的图像生成模型 DALL-E ,采用与 GPT 模型类似的架构和训练过程,可以根据用户的文本输入生成各种风格的图像

DALL-E 的发展与设计过程对后来的模型(如 DALL-E 2 和 MidJourney)都具有指导作用,它的成功为推动多模态领域的研究和创新奠定了基础。

2022年:ChatGPT 的诞生与发展

随后,OpenAI 的研究团队对 GPT-3 模型进一步改进,并将新模型命名为 GPT-3.5,采用了最简单的用户界面。由此,语言模型的不断发展促使了 ChatGPT 在 2022 年 11 月 30 日诞生。如今,又衍生出升级版本 GPT-4,再次将生成式人工智能的成就推向一个新高度。

正如 Sam 的先前所说的那样,这一切引发了世界范围内的 AI 变革。在短短的五天内,ChatGPT 吸引了逾百万用户注册使用,创下了产品史上用户增长最快的记录。包括 ChatGPT 的创造者在内,所有人都对这一产品的成功感到震惊。

在 OpenAI 的发展过程中,Ilya 不仅关心技术创新,而且认真对待潜在的风险,他格外关注人工智能的安全性,并在公司内积极为人工智能系统的安全性分配更多资源。他领导着公司的 Superalignment 团队,专注于管理人工智能带来的潜在风险。为实现这一目标,将公司计算能力 20% 的资源用于解决与人工智能安全性相关的问题

这又将我们带回了他与 Sam 的冲突上,Ilya 的谨慎立场显然与 Sam 更为激进的做法产生了分歧,后者倾向于更快地推进开发强大的人工智能,事态随后发展到 OpenAI 董事会成员策划撤职 Sam Altman,用似乎更为稳重的 Emmett Shear 替代他。但随之另一位联合创始人 Greg 也宣布辞职,同时 700 多名员工联名声讨董事会,仅仅几天后,Sam 又回到了 OpenAI……

总结

在吃瓜之余,抛开 ChatGPT 的诞生与成长来说,Ilya 对整个人工智能领域也有着重要影响。

在过去的十多年里,Ilya 立足于人工智能变革的前沿,其每个阶段的成果都可能是我们一生也无法企及的高度

Ilya 参与或主导的工作一度改变了计算机视觉领域、机器翻译甚至自然语言处理领域的研究进程,其研究工作被引用超过 42.7 万次,成为引用量最多的计算机科学家之一。在 2015 年,MIT还将他列为全球 35 位最重要的创新者之一,时代杂志也将他评为最具影响力的人物之一。

或许有朝一日,当AGI真正改变世界的时候,Ilya 将会被誉为历史上最重要的科学家之一,在人工智能领域的贡献也将会被所有人熟知。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1261733.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

利略版本的发布标志着EndeavourOS从Xfce转向KDE Plasma

导读EndeavourOS,一个基于 Arch Linux 的滚动发行版,今日发布了其最新版本——伽利略(Galileo)。这次更新带来了一些重大变革,令其用户群体充满期待。 伽利略版本除了采用最新、优质的 Linux 6.6 LTS 内核系列外&…

什么是企业数字化转型?如何利用数字化工具加快转型速度?

企业数字化转型是指将数字技术整合到所有业务领域,从根本上改变业务运作和为客户提供价值的方式。它包括采用新的工具、过程和策略来提高效率、创新和客户满意度。数字化转型可以帮助公司在基础层面上规划、实施和管理业务流程。它提供了员工和客户所期望的先进体验…

企业内部社区在促进员工之间的合作与共建

企业内部社区作为一种新兴的企业管理工具,在企业管理中展现出了巨大的价值和作用。它为企业内部员工提供了一个良好的交流互动平台,促进了信息共享、知识传递和团队协作,提升了企业的创新能力和竞争力。 企业内部社区通过问卷收集功能&#…

DjiTello + YoloV5的无人机的抽烟检测

一、效果展示 注:此项目纯作者自己原创,创作不易,不经同意不给予搬运权限,转发前请联系我,源码较大需要者评论获取,谢谢配合! 1、未启动飞行模型无人机的目标检测。 DjiTello YOLOV5抽烟检测 …

“职场中的‘特色人物’:与‘个性’领导和同事的碰撞与成长“

文章目录 每日一句正能量前言程序员是怎么和产品经理battle的?科班程序员非科班程序员 程序员的团队合作密码:协作与领导的艺术职场人际关系的技巧后记 每日一句正能量 乌云的背后是阳光,阳光的背后是彩虹。 前言 在职场中,我们都…

护眼灯什么价位的好?好用又实惠的护眼台灯推荐

我国8~12岁的小学生中,约有47个儿童就有一个近视眼,近视发病率约为23%,中学生约为55%,大学生约为76%,全国近视眼约为3亿人,其中青少年约为2亿人。全国近视眼发病人数位居世界首位,发…

PostgreSQL 数据脱敏方式盘点

数据脱敏是一种广泛采用的保护敏感数据(如信用卡,社保卡,地址等信息)的方法。脱敏数据不仅仅是为了保护你和客户的数据安全,在一些情况下,法律也有相应要求,最著名的例子就是 GDPR。 市面上也有…

docker-compose部署zabbix+grafana

1.引言 1.1目的 zabbixgrafana实现图形化监控 2.部署环境 服务器ip服务版本192.168.5.137zabbix-server6.0.21192.168.5.137grafana10.2.2192.168.5.152zabbix-client6.0.21 3.部署zabbix-server 3.1 创建zabbix目录 mkdir zabbix3.2 编写docker-compose文件 cd zabbix…

医学影像PACS源码:PACS系统的基础知识(DICOM、HL7、SWF)

1、PACS PACS是Picture Archiving and Communication Systems首字母缩写,全称为影像储存和传输系统,涉及放射医学、计算机技术、通讯技术及数字图像技术等,是医院信息系统的重要组成部分,是将数字医疗设备(如X线、CT、MRI、超声、…

P8A110-A120经典赛题

Web应用程序SQL Inject安全攻防 任务环境说明: 服务器场景:WebServ2003(用户名:administrator;密码:空)服务器场景操作系统:Microsoft Windows2003 Server 服务器场景安装服务/工…

matlab配置

matlab配置 windowslinux windows 按照这里一步步配置就行( 移动硬盘中软件备份中自取) linux linux配置步骤

【C/PTA —— 12.指针1(课外实践)】

C/PTA —— 12.指针1(课外实践) 一.函数题6-1 删除字符串中数字字符6-2 找最大值及其下标6-3 求两数平方根之和6-4 求一组数中的最大值、最小值和平均值6-5 两个4位正整数的后两位互换6-6 判断回文字符串 二.程序题7-1 求矩阵每行元素的和 一.函数题 6-…

在 C# 中复制 Word、Excel、PDF 和 PPT 文档

在 C# 中复制文档可能是各种软件应用程序中的一项基本任务。无论您是构建文件管理系统、创建备份实用程序,还是出于任何原因仅需要复制文档,都需要高效的文件处理和复制机制。在这篇博文中,我们将引导您逐步完成在 C# 中复制文档的过程。在代…

IDEA懒人必备插件:自动生成单元测试!

IDEA懒人必备插件:自动生成单元测试! 前言1、打开设置 File-->settings-->Plugins, 搜索 Squaretest2、安装完成后重启idea ,你会发现,导航栏位置已经多了一个选项3、接着就在你想要测试的类中 用快捷键 altInse…

值得收藏的 6 个顶级 Mac 数据恢复软件榜单

对于 Mac 用户来说,丢失重要数据可能是一场真正的噩梦。无论是意外删除、系统崩溃还是狡猾的恶意软件,后果都可能是毁灭性的。幸运的是,Mac 数据恢复软件带来了一线希望。这些工具旨在帮助您轻松恢复珍贵的文件,无论是什么原因导致…

使用Moment.js中获取上周的开始日期和结束日期(可自定义)

前言 有时候需求是这样的,想要获取上周的开始日期和结束日期,或者前几周的时间范围 比如今天是2023.11.28号,我想获取上周的周一到周日,也就是,上周的开始日期: 2023-11-20,上周的结束日期: 2023-11-26 1.…

Digicert OV 代码签名介绍

Digicert OV 代码签名证书是一种数字证书,用于对软件代码进行数字签名。数字签名是一种验证软件来源和完整性的技术,通过使用私有密钥对代码进行签名,并在签名后使用公共密钥验证签名。 可基于更多平台,最大限度地提高分发量和收…

Proto3语法详解02

目录 1.默认值 2.更新消息 2.1更新规则 2.2保留字段reserved 2.2.1创建通讯录3.0版本---验证错误删除字段造成的数据损坏 2.3未知字段 2.3.1未知字段从哪获取 3.3.2升级通讯录3.1版本--验证未知字段 2.4前后兼容性 3.选项option 3.1选项分类 3.2常用选项列举 1.默认值…

Valentina Studio Pro:引领数据库管理软件新潮流

你是否正在寻找一款强大且易用的数据库管理软件?Valentina Studio Pro可能就是你的不二之选。这款软件是由Valentina Team开发的一款综合性数据库管理和编辑工具,它支持多种数据库系统,包括MySQL、PostgreSQL、SQLite等。 Valentina Studio …

前端页面带值跳转

前端页面带值跳转 querry>url searchParamers,url后附加参数,传递的值长度与有限vuex(全局状态管理),搜索页面将关键词塞到状态中,所搜结果页从状态取值。 使用axios整合前后端 axios官网:axios 在前…