新加坡国立大学尤洋:我的四个选择,本质的喜欢催动长久的坚持丨青源专栏...

news2024/11/24 8:26:50

为了启发青年学者思考职业发展,激发科研灵感,智源社区推出青源专栏,定期邀请青源会员分享他们的研究思考和科研感悟。新加坡国立大学计算机系校长青年教授、青源会会员尤洋分享了他在高性能计算研究、创业经历以及在新加坡的生活所感。从求学读博跟随高性能计算专家James Demmel,到去往异国任教,再到后来几经辗转的创业之路,尤洋娓娓道来了人生中几次关键性的选择。他坚信,对于任何事或者人,只有本质的喜欢才能催动长久的坚持。

4021c7888bc4df3eaab19da011eddb62.jpeg

尤洋

他是新加坡国立大学计算机系的校长青年教授(PresidentialYoungProfessor),此前从加州大学伯克利分校计算机系获得了博士学位。尤洋的研究兴趣包括高性能计算、并行算法,以及机器学习。他当前的研究重点是大规模深度学习训练算法的分布式优化,曾创造ImageNet以及BERT训练速度的世界纪录,被几十家媒体广泛报道。他设计的算法被广泛应用于谷歌、微软、英特尔、英伟达等科技企业。尤洋近三年以第一作者身份在NIPS、ICLR、Supercomputing、IPDPS、ICS等国际重要会议或期刊上发表论文十余篇,并曾以第一作者身份获得了国际并行与分布式处理大会(IPDPS)的最佳论文(0.8%获奖率)和国际并行处理大会(ICPP)的最佳论文(0.3%获奖率)。尤洋在2021年入选福布斯30岁以下精英榜 (亚洲)并获得IEEE-CS超算杰出新人奖。同时,他也是潞晨科技 (HPC-AI Tech)的创始人。

 整理:李梦佳

研究之选:在实践中设计算法,

「我成了谷歌内部做实验最多的人」

我博士阶段的研究方向是高性能计算(High Performance Computing),意思就是提升计算效率。在这方面做的最好的就是英伟达,英伟达GPU最开始是做游戏或图形处理,游戏图形处理和渲染需要很强的算力。英伟达CUDA做了很多这方面的优化,之后AI或者深度学习出来之后,对算力的要求很高,所以对高性能计算就有了很多的期待和需求。

于是我们与时俱进,因为高性能计算相当于我们的工具或锤子,AI是我们的钉子。很自然地,我现在就在做HPC+AI。最初选择这个方向,源于学习了英伟达的一些教程,发现了其中的乐趣。

我针对 ImageNet 图像数据集的训练提出了 LARS 优化器被 Facebook、腾讯、索尼、谷歌、富士通等公司使用,将 ImageNet 训练的时间从一小时缩短到了一分钟;针对 BERT 设计的 LAMB 方法则将三天三夜的训练时间缩短到了 76 分钟。这两项工作当时创造了ImageNet以及BERT训练速度的世界纪录,并被ScienceDaily、TheNextWeb、i-programmer等几十家媒体报道。

相比学校,英伟达、谷歌在内的硅谷最有影响力的大公司,计算资源十分丰富,英伟达GPU、谷歌TPU等内部可以无限使用。当时我与导师商量,想去工业界多实习,他也比较支持我。

根据伯克利的政策,在全职实习结束后,学生也可以每周投入一两天去工业界实习,于是我选择了加入谷歌。有趣的是,我作为实习生,几乎成了谷歌内部做实验做得最多的人,对实验细节非常清楚。当时估算了一下,一年如果按照TPU云计算市场的价格来算的话,大概花了谷歌上千万美元来做实验(当然在内部也不收我的钱)。经过实习,我摸清了很多tricks,也发现了很多规律,并结合这些规律设计了我自己的算法,实践是主要的驱动力。

基于这段经历给我的启发,目前我们的团队打造了名为「Colossal-AI」的高性能计算平台,它包括高效内存管理系统、自动的 N-维并行化系统和基于优化的动态调度系统。未来,我们的愿景是使用户可以在服务器、终端、甚至是手机上定义好模型,将其通过 Colossal AI 部署至云端,支持 CPU、GPU、TPU、FPGA 等多种硬件平台和 TensorFlow、PyTorch、Keras、Theano 等多种编程框架。这将帮助更多的高效、初创公司能够最大化效率、最小化成本,从而部署自己的模型和系统。

值得一提的是,实验环境与商业环境下的并行计算有一定区别。在实验室或者公司的研发部门训练模型,一般设为一个静态的过程,实验可以中间暂停。而在生产环境下,传统的并行计算(非AI)属于并发问题。比如,百度的搜索引擎如何处理大量的request,本质上也是一个并行计算的问题,它比较偏实时,注重scalability,即从10个用户扩展到100个用户或者1万个用户,能不能让用户的延迟不变,保持稳定性最为重要。

735897fcc0c85819fe035226d86dbdf1.png

对于企业来说,硬件部署所需要的资金成本是十分关键的因素。如何打造高效率、低能耗的分布式人工智能系统至关重要。为此,Colossal AI 从「自动最大化并行计算」、「动态调度系统」、「内存优化」三个层面上提出了目前最先进的高性能计算解决方案。Colossal AI 是最完整实现并行化计算的高性能计算框架之一,支持层与层之间的流水线并行、张量并行、序列并行、数据并行优化。在张量并行方面,Colossal AI 实现了二维网格参数划分、三维立体参数划分、以及2.5维通信最小化参数划分。

8a80221a92f208da0f24c3633f86084f.png

在动态调度系统方面,我们实现了高效、高质量的动态资源管理。在芯片、batch 层面上实现了 GPU 使用率的最大化、通过广播训练状态和模型权重实现了高速工作迁移;根据中心训练状态检测器逐渐扩大 batch size 保证训练的稳定,并且使用了 LARS、LAMB 等先进的优化器。为了实现低成本的大规模 AI 模型调优,Colossal AI 还通过多级卸载实现了动态、智能、高效的内存优化与调度。

展望未来,高性能计算(HPC)领域重点在于它的可扩展性(auto-scaling)。对于用户而言,使用一个GPU的体验,应该和用一万个GPU的体验几乎没有区别,具有auto-scaling的能力。而在学术研究方面,我主要关注模型优化方法的开发,也关注 AIGC 或者自监督学习等新兴的研究课题。

大师之选:HPC专家James Demmel

教给我的包容和自由

在美国,研究者们从80年代就开始探索高性能计算,图灵奖得主Jack Dongarra实现了第一个世界上高效的矩阵乘矩阵的库,包括matlab也是基于他的工作。中国起步较晚,一直处于追赶状态,直到今天美国仍处于领先地位。高性能计算和国家战略挂钩,需要超级计算机,斯坦福、MIT等都无法过多投入在高性能计算方向。而伯克利是公立学校,有劳伦斯伯克利国家实验室,伯克利就有天然的优势去做高性能计算。

而我的博士导师James Demmel就是全世界研究HPC最知名的专家。他是美国科学与工程院院士,未来也有望获得图灵奖。他当过EECS学院的院长和计算机系主任。他给我印象最深的一点在于他的包容性特别强。

58f22500489df78b5ec03e76ce4057b8.jpeg

James Demmel教授

这种包容性从日常小事中就可见一斑。有一次他的一个博士后找他写推荐信,推荐到以色列的高校。他决定要帮那个学生,联系了很多学校,最后确实帮他拿到一两个offer。但是虽然他大费周章,最后学生决定不去了。一般正常人听到之后可能会比较生气,身为一个院士费了一番功夫帮你联系最后却不去了,反而还会把别人得罪。

我导师知道这件事后,只是笑笑说,「he changed his mind」。他对我影响最大的就是自由和包容。现在我自己作为教授和创业公司的创始人,也会平和接受年轻员工或学生的来去自由。他在教学上不吝付出,包括和本科生讲课也会花很多时间去备课。读博期间,我的几篇论文和他的职业生涯相比也许不足道,这不影响他在我身上投入大量时间。他在飞机上都还在帮我改论文,让我很感动。

创业之选:成为AI领域的Databricks

(注:2022年9月1日,潞晨科技宣布完成600万美元种子及天使轮融资)

关于为什么选择去创业,是因为我坚信,我们的技术和产品在未来AI落地过程中很重要,这是我的信仰。而信仰之外,投资人更看重的是效率,如何将技术迅速转化成产品。最前沿的技术过一二十年才能实现,技术落地意在将不现实因素去掉,力求短时间内普及或落地,帮助用户提升效率。对于我们公司而言,一个指针就是帮助AI企业加快AI产品开发速度,帮他们省钱,比如做一期AI产品需要投入300万人民币,我们试着100万人民币帮他做下来。

如果选取一个榜样或参照,我们其实想成为AI领域的Databricks。这家公司也由伯克利教授所创立,估值已达400多亿美金。Databricks的目标是提升大数据处理的效率,我们则是提升AI处理计算的效率,本质上类似,只是做的产品不同,他是我们一个很好的学习榜样。

这家公司成功的原因,第一,它的开源产品经得住市场的考验,世界500强中有多家公司都使用过它的大数据处理产品。第二,商业模式最终还是成功了,通过商业模式的合理设计,和亚马逊、谷歌等云厂商不产生竞争,这样使得它能够很好的存活下来,利润率也做得很高。

从0到1,再从1到10,创业公司想走向成功,我总结了几点困难:

  • 第一,做成这个(软件)之后,上市的企业到底喜不喜欢它,好不好用。

  • 第二,目标无法实现。比如设想加速10倍,做的过程中,我发现我不管怎么做还是到不了5倍。

  • 最后一点,软件做得很好,也达到预期目标,市场也很喜欢,但最终没人愿意付费。这就涉及到商业模式的问题,需要把整个链路跑通。

现阶段我们已经积累了一定的用户,也在向着这几个总体目标努力着。

很多人问我,当教授和创业者有什么区别?当教授,尤其是在美国做教授,需要自己去申请funding,申请完拿来去买机器、招学生、招博士后甚至招工程师。可能也面临着去能源部、甚至国防部去拿经费。而创业者是去向VC推销自己的技术或者产品,这点是很相似的。另外比较相似的是,大家都独立地去做事情。在学校做项目,在公司做产品,无论如何要把东西做好,都需要团队配合。值得一提的是,作为创业者,敢于冒险的探索精神是必要的,因为我们拿到的钱都是风险投资,本来就会有失败;更要快速适应变化,比如近期大火的AIGC,一瞬间所有投资人都在关注这个领域,因此创业必须要与时俱进。

一些有意思的人

我也想想讲讲一些遇见过的有趣的大佬。作为学生在谷歌实习期间,也有幸曾到黄教主家去拜访参观。作为华人,他的家布满东方文化,无论是从吃东西的餐具,到家庭布置等都非常diverse,他家中也有瓷器,还有很多印度人送的东西。他娶了个美国人当太太,他家的主流文化还是西方文化。他本人也比较传奇,看得出是个崇尚刺激的人。他有很多赛车服和跑车。

5be01202698bb962c5559005bd6aa912.jpeg

我印象最深的一点,黄教主本人十分平易近人,去他家的时候我还是个学生,他还专门给我开了啤酒,也没有拒绝和我合照。我见过一些亿万富翁,当学生的时候和他们拍照,他们一般会说不合适,或者拍照的时候板着脸,没有他这样随和。

另外就是我们的第一个投资人创新工场的李开复老师。就在最近,刚刚又和他在硅谷度过了充实的一周,还见到了雅虎创始人杨致远,OpenAI的两位创始人,斯坦福、伯克利的知名教授,以及很多科技朋友。还吃到了开复老师亲手做的卤肉饭和牛肉面。和投资人交流是很开心的经历。

生活之选:

在花园城市,和所爱的人一起生活

目前,我大部分时间都在新加坡国立大学任教。新国立和伯克利、包括国内清华姚班的教学制度类似,学校很强调每位教职人员的独立性。系主任不等同于我的领导,只要没有学术道德问题,系主任也无权干涉我的工作,这种制度比较有利于科研创新。

工作选择上,我当时也拿了几个美国学校的offer,相较而言新加坡的工作待遇反而更高。之所以最终选择去新加坡,也是因为我是一个注重生活质量的人。在美国,吃一顿中餐要开车好几个小时,而新加坡小而干净,还是华人社会,无论是饮食,还是基础设施各方面,当然和美国相比更适合华人。游玩方面,新加坡市内也有很多自然公园,有很多划船等娱乐设施,也有环球影城,当然更重要的是那一带签证比较方便。从新加坡去普吉岛、马来西亚或者马尔代夫很方便,整体上我对新加坡的工作生活目前来看还是比较满意。

601c35b6c2789be69c659d55b5f4a618.jpeg

个人方面,我读博期间就结婚了,我虽然今年才31岁,但是我已经有两个孩子。很多人觉得结婚很浪费时间。李开复老师就是一个鲜活的例子,他也读了博士,21岁就结婚了。其实结婚早反而会让人更加专注。我认识的一个同学,因为和女朋友分手,大半年人就很颓废,反而影响到了他很多,毕竟这是我们人生发展必须要做的事情。当然人生的成功可能是由自己定义的,并不是由一些KPI决定的。

当我们为某件事,某个人付出了很多时间和精力,最初的动力是源于我们的在乎,源于最本质的喜欢。我甚至想,不应该过多追求这种人际关系或者恋爱关系中的舒服感,舒服感可能只是持续一段很短的时间,本质的喜欢可能更持久,因为不管和谁结婚,最终都会有遗憾。

就像张朝阳说的,他都是亿万富翁了,还是感觉很焦虑很不满足,因为人类本身就是非常贪婪的。我们人生可能就只有三四万天,有效的生命只有两万天,为什么我们不做一些喜欢的事情(比如说创业)。我觉得不妨大胆地去努力和一个最喜欢的人在一起,这样即便有遗憾,也是值得的。

更多内容 尽在智源社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/53582.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

006. 分割回文串

1.题目链接: 131. 分割回文串 2.解题思路: 2.1.题目要求: 给一个字符串 s ,要求把 s 分割成一些子串,并使每个子串都是 回文串。 回文串的概念:正反顺序都一样的字符串。 举例: 输入&#…

IC模拟版图工程师高薪进阶之路,三年实现年薪30w+

模拟版图是模拟IC设计岗位的一种,随着国内半导体行业的不断发展,岗位的需求也越来越多。而每个芯片最终能够付诸于生产都离不开模拟版图设计师的功劳,所以目前芯片产业对于这类人才需求越来越大。 什么是模拟版图设计工程师? 模…

BSA牛血清白蛋白修饰Fe3O4纳米颗粒 BSA-MION

产品名称:BSA牛血清白蛋白修饰Fe3O4纳米颗粒 英文名称:BSA-MION 用途:科研 状态:固体/粉末/溶液 产品规格:1g/5g/10g 保存:冷藏 储藏条件:-20℃ 储存时间:1年 牛血清中的简单蛋白&am…

2022年第十一届认证杯数学中国数学建模国际赛小美赛:D题野生动物贸易是否应该长期禁止建模方案及代码实现

更新进展 (1)2022-12-2 9:00 发布预售 (2)2022-12-2 10:40 发布建模思路、代码以及参考文献 (3)待更新内容:进一步对全部数据分析 1 题目 野生动物市场被怀疑是当前疫情和2002年SARS疫情的…

blender中的灯光和相机

灯光环境光灯光基础灯光基本属性 EV渲染器日光面光天空盒IES灯光 (灯光遮罩)自发光移动摄像机切换摄像机摄像机属性环境光 在渲染视图中,没有任何光时,物体只受环境光的影响 灯光基础 1 四种灯光,点光,…

安卓期末大作业——仿番茄免费小说APP

《移动应用开发实践》实践报告 APP名称: 番茄免费小说 要求: 格式:宋体,小四号字;首行缩进;行距:1.5倍。 每人独立完成Android App的设计与开发App必须包含SOLite数据库操作 一、所调查的Ap…

Android -- 每日一问:能讲讲 Android 的 Handler 机制吗?

典型回答 讲清楚Android中的消息机制,先表述一下和Handler相关的一些类: Message:消息分为硬件产生的消息(如按钮、触摸)和软件生成的消息; MessageQueue:消息队列的主要功能向消息池投递消息(MessageQueue.enqueueMe…

疫情下为什么年轻、未婚女性更容易拿到offer

最近发现一个奇怪的现象,为什么会奇怪。大家别着急,容我慢慢道来。由于疫情开始后,也是大家开始躺平后,企业在有意、无意的疯狂裁员,导致人心惶惶,大家都不敢轻易跳槽了。甚至有的人很庆幸,有份…

一文弄懂JUnit5相关注解

JUnit5 JUnit是Java生态系统中最流行的单元测试框架之一。JUnit5版本包含许多令人兴奋的创新,其目标是支持Java8和更高版本中的新功能,并支持多种不同风格的测试。 Maven依赖 启动JUnit5.x.0非常简单;我们只需要将以下依赖项添加到pom.xml…

昆石网络 VOS3000虚拟运营支撑系统任意文件读取漏洞

漏洞描述: 昆石网络 VOS3000虚拟运营支撑系统 通过 %c0%ae%c0%ae 等字符绕过检测,可导致任意文件读取漏洞。 漏洞利用条件: 对⽤户查看或下载的⽂件没有限制或者限制绕过,就可以查看或下载任意⽂件 漏洞影响范围: VOS3000 漏…

阿里云Redis性能压力测试(二十)

文章目录1.云Redis性能压力测试2.安装redis-banchmark压测工具3.压测两节点的Redis集群4.压测四节点的Redis集群4.1.扩容集群为四节点4.2.压力测试5.压测结果对比1.云Redis性能压力测试 我们当前Redis集群是2个节点2个分片,使用redis-benchmark工具对Redis集群进行…

轨迹预测——day 57 基于车道交叉和考虑驾驶方式的终点生成模型的前目标车辆轨迹预测

Trajectory Prediction of Preceding Target Vehicles Based on Lane Crossing and Final Points Generation Model Considering Driving Styles导读II.问题表述与系统架构A. Trajectory Prediction for PTVs(preceding target vehicles)B. Position and…

python自学程序练习01:99乘法表

#完成99乘法表 #1*11 #1*22 2*24 #1*33 2*36 3*39 #很明显要两个循环print(打印99乘法表:) for i in range(1,10):for j in range(1, i1):print(f{j}*{i}{j * i}, end )结果如上图所示,很明显发现,是我们想要的数据但是他的形式需要有所修改。…

Vue3创建项目(四)main.js配置,避坑指南

系列文章目录 第一篇 Vue3创建项目(一)新手教程 第二篇 Vue3创建项目(二)router路由配置和使用 第三篇 Vue3创建项目(三)Vuex配置 目录 系列文章目录 main.js配置,直接看图,如下…

作为前端你还不懂MutationObserver?那Out了

🐱个人主页:不叫猫先生 🙋‍♂️作者简介:前端领域新星创作者、华为云享专家、阿里云专家博主,专注于前端各领域技术,共同学习共同进步,一起加油呀! 💫系列专栏&#xff…

Netty(一)- Netty与BIO、NIO、AIO介绍

文章目录一、Netty的介绍二、Netty的应用场景1. 互联网行业2. 游戏行业3. 大数据领域三、I/O模型1. Java BIO(1)Java BIO 基本介绍(2)Java BIO 工作机制(3)Java BIO 应用实例(4)Java…

css如何快速将网站设置为灰色背景

突然想起写这篇文章是因为,公司的产品大早上打电话说:“赶紧,业务刚通知,我们的官网、小程序、公众号的首页需要变为灰色背景,最好在10点半之前上线”。当时心有千般不愿,但最后生活压倒我坚硬的脊梁。哈哈…

关于《web课程设计》网页设计 用html css做一个漂亮的网站 仿新浪微博个人主页

🎉精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

C语言用高斯消元法求行列式

目录 数学原理 程序设计 整体流程与代码 测试函数 测试结果 数学原理 高斯消元法求行列式:利用初等行变换,化为上三角行列式,求其主对角线的乘积 行列式的初等行变换: 1)换行变换:交换两行&#xf…

静态路由配置案例

静态路由配置案例配置静态路由原理命令:案例:最后结果:配置静态路由原理命令: [Huawei]ip route-static 来源ip 子网掩码 去向ip [Huawei]ip route-static 192.168.20.1 255.255.255.0 192.168.1.2 案例: pc1,pc2,a…