为了启发青年学者思考职业发展,激发科研灵感,智源社区推出青源专栏,定期邀请青源会员分享他们的研究思考和科研感悟。新加坡国立大学计算机系校长青年教授、青源会会员尤洋分享了他在高性能计算研究、创业经历以及在新加坡的生活所感。从求学读博跟随高性能计算专家James Demmel,到去往异国任教,再到后来几经辗转的创业之路,尤洋娓娓道来了人生中几次关键性的选择。他坚信,对于任何事或者人,只有本质的喜欢才能催动长久的坚持。
尤洋
他是新加坡国立大学计算机系的校长青年教授(PresidentialYoungProfessor),此前从加州大学伯克利分校计算机系获得了博士学位。尤洋的研究兴趣包括高性能计算、并行算法,以及机器学习。他当前的研究重点是大规模深度学习训练算法的分布式优化,曾创造ImageNet以及BERT训练速度的世界纪录,被几十家媒体广泛报道。他设计的算法被广泛应用于谷歌、微软、英特尔、英伟达等科技企业。尤洋近三年以第一作者身份在NIPS、ICLR、Supercomputing、IPDPS、ICS等国际重要会议或期刊上发表论文十余篇,并曾以第一作者身份获得了国际并行与分布式处理大会(IPDPS)的最佳论文(0.8%获奖率)和国际并行处理大会(ICPP)的最佳论文(0.3%获奖率)。尤洋在2021年入选福布斯30岁以下精英榜 (亚洲)并获得IEEE-CS超算杰出新人奖。同时,他也是潞晨科技 (HPC-AI Tech)的创始人。
整理:李梦佳
“
研究之选:在实践中设计算法,
「我成了谷歌内部做实验最多的人」
我博士阶段的研究方向是高性能计算(High Performance Computing),意思就是提升计算效率。在这方面做的最好的就是英伟达,英伟达GPU最开始是做游戏或图形处理,游戏图形处理和渲染需要很强的算力。英伟达CUDA做了很多这方面的优化,之后AI或者深度学习出来之后,对算力的要求很高,所以对高性能计算就有了很多的期待和需求。
于是我们与时俱进,因为高性能计算相当于我们的工具或锤子,AI是我们的钉子。很自然地,我现在就在做HPC+AI。最初选择这个方向,源于学习了英伟达的一些教程,发现了其中的乐趣。
我针对 ImageNet 图像数据集的训练提出了 LARS 优化器被 Facebook、腾讯、索尼、谷歌、富士通等公司使用,将 ImageNet 训练的时间从一小时缩短到了一分钟;针对 BERT 设计的 LAMB 方法则将三天三夜的训练时间缩短到了 76 分钟。这两项工作当时创造了ImageNet以及BERT训练速度的世界纪录,并被ScienceDaily、TheNextWeb、i-programmer等几十家媒体报道。
相比学校,英伟达、谷歌在内的硅谷最有影响力的大公司,计算资源十分丰富,英伟达GPU、谷歌TPU等内部可以无限使用。当时我与导师商量,想去工业界多实习,他也比较支持我。
根据伯克利的政策,在全职实习结束后,学生也可以每周投入一两天去工业界实习,于是我选择了加入谷歌。有趣的是,我作为实习生,几乎成了谷歌内部做实验做得最多的人,对实验细节非常清楚。当时估算了一下,一年如果按照TPU云计算市场的价格来算的话,大概花了谷歌上千万美元来做实验(当然在内部也不收我的钱)。经过实习,我摸清了很多tricks,也发现了很多规律,并结合这些规律设计了我自己的算法,实践是主要的驱动力。
基于这段经历给我的启发,目前我们的团队打造了名为「Colossal-AI」的高性能计算平台,它包括高效内存管理系统、自动的 N-维并行化系统和基于优化的动态调度系统。未来,我们的愿景是使用户可以在服务器、终端、甚至是手机上定义好模型,将其通过 Colossal AI 部署至云端,支持 CPU、GPU、TPU、FPGA 等多种硬件平台和 TensorFlow、PyTorch、Keras、Theano 等多种编程框架。这将帮助更多的高效、初创公司能够最大化效率、最小化成本,从而部署自己的模型和系统。
值得一提的是,实验环境与商业环境下的并行计算有一定区别。在实验室或者公司的研发部门训练模型,一般设为一个静态的过程,实验可以中间暂停。而在生产环境下,传统的并行计算(非AI)属于并发问题。比如,百度的搜索引擎如何处理大量的request,本质上也是一个并行计算的问题,它比较偏实时,注重scalability,即从10个用户扩展到100个用户或者1万个用户,能不能让用户的延迟不变,保持稳定性最为重要。
对于企业来说,硬件部署所需要的资金成本是十分关键的因素。如何打造高效率、低能耗的分布式人工智能系统至关重要。为此,Colossal AI 从「自动最大化并行计算」、「动态调度系统」、「内存优化」三个层面上提出了目前最先进的高性能计算解决方案。Colossal AI 是最完整实现并行化计算的高性能计算框架之一,支持层与层之间的流水线并行、张量并行、序列并行、数据并行优化。在张量并行方面,Colossal AI 实现了二维网格参数划分、三维立体参数划分、以及2.5维通信最小化参数划分。
在动态调度系统方面,我们实现了高效、高质量的动态资源管理。在芯片、batch 层面上实现了 GPU 使用率的最大化、通过广播训练状态和模型权重实现了高速工作迁移;根据中心训练状态检测器逐渐扩大 batch size 保证训练的稳定,并且使用了 LARS、LAMB 等先进的优化器。为了实现低成本的大规模 AI 模型调优,Colossal AI 还通过多级卸载实现了动态、智能、高效的内存优化与调度。
展望未来,高性能计算(HPC)领域重点在于它的可扩展性(auto-scaling)。对于用户而言,使用一个GPU的体验,应该和用一万个GPU的体验几乎没有区别,具有auto-scaling的能力。而在学术研究方面,我主要关注模型优化方法的开发,也关注 AIGC 或者自监督学习等新兴的研究课题。
“
大师之选:HPC专家James Demmel
教给我的包容和自由
在美国,研究者们从80年代就开始探索高性能计算,图灵奖得主Jack Dongarra实现了第一个世界上高效的矩阵乘矩阵的库,包括matlab也是基于他的工作。中国起步较晚,一直处于追赶状态,直到今天美国仍处于领先地位。高性能计算和国家战略挂钩,需要超级计算机,斯坦福、MIT等都无法过多投入在高性能计算方向。而伯克利是公立学校,有劳伦斯伯克利国家实验室,伯克利就有天然的优势去做高性能计算。
而我的博士导师James Demmel就是全世界研究HPC最知名的专家。他是美国科学与工程院院士,未来也有望获得图灵奖。他当过EECS学院的院长和计算机系主任。他给我印象最深的一点在于他的包容性特别强。
James Demmel教授
这种包容性从日常小事中就可见一斑。有一次他的一个博士后找他写推荐信,推荐到以色列的高校。他决定要帮那个学生,联系了很多学校,最后确实帮他拿到一两个offer。但是虽然他大费周章,最后学生决定不去了。一般正常人听到之后可能会比较生气,身为一个院士费了一番功夫帮你联系最后却不去了,反而还会把别人得罪。
我导师知道这件事后,只是笑笑说,「he changed his mind」。他对我影响最大的就是自由和包容。现在我自己作为教授和创业公司的创始人,也会平和接受年轻员工或学生的来去自由。他在教学上不吝付出,包括和本科生讲课也会花很多时间去备课。读博期间,我的几篇论文和他的职业生涯相比也许不足道,这不影响他在我身上投入大量时间。他在飞机上都还在帮我改论文,让我很感动。
“
创业之选:成为AI领域的Databricks
(注:2022年9月1日,潞晨科技宣布完成600万美元种子及天使轮融资)
关于为什么选择去创业,是因为我坚信,我们的技术和产品在未来AI落地过程中很重要,这是我的信仰。而信仰之外,投资人更看重的是效率,如何将技术迅速转化成产品。最前沿的技术过一二十年才能实现,技术落地意在将不现实因素去掉,力求短时间内普及或落地,帮助用户提升效率。对于我们公司而言,一个指针就是帮助AI企业加快AI产品开发速度,帮他们省钱,比如做一期AI产品需要投入300万人民币,我们试着100万人民币帮他做下来。
如果选取一个榜样或参照,我们其实想成为AI领域的Databricks。这家公司也由伯克利教授所创立,估值已达400多亿美金。Databricks的目标是提升大数据处理的效率,我们则是提升AI处理计算的效率,本质上类似,只是做的产品不同,他是我们一个很好的学习榜样。
这家公司成功的原因,第一,它的开源产品经得住市场的考验,世界500强中有多家公司都使用过它的大数据处理产品。第二,商业模式最终还是成功了,通过商业模式的合理设计,和亚马逊、谷歌等云厂商不产生竞争,这样使得它能够很好的存活下来,利润率也做得很高。
从0到1,再从1到10,创业公司想走向成功,我总结了几点困难:
第一,做成这个(软件)之后,上市的企业到底喜不喜欢它,好不好用。
第二,目标无法实现。比如设想加速10倍,做的过程中,我发现我不管怎么做还是到不了5倍。
最后一点,软件做得很好,也达到预期目标,市场也很喜欢,但最终没人愿意付费。这就涉及到商业模式的问题,需要把整个链路跑通。
现阶段我们已经积累了一定的用户,也在向着这几个总体目标努力着。
很多人问我,当教授和创业者有什么区别?当教授,尤其是在美国做教授,需要自己去申请funding,申请完拿来去买机器、招学生、招博士后甚至招工程师。可能也面临着去能源部、甚至国防部去拿经费。而创业者是去向VC推销自己的技术或者产品,这点是很相似的。另外比较相似的是,大家都独立地去做事情。在学校做项目,在公司做产品,无论如何要把东西做好,都需要团队配合。值得一提的是,作为创业者,敢于冒险的探索精神是必要的,因为我们拿到的钱都是风险投资,本来就会有失败;更要快速适应变化,比如近期大火的AIGC,一瞬间所有投资人都在关注这个领域,因此创业必须要与时俱进。
“
一些有意思的人
我也想想讲讲一些遇见过的有趣的大佬。作为学生在谷歌实习期间,也有幸曾到黄教主家去拜访参观。作为华人,他的家布满东方文化,无论是从吃东西的餐具,到家庭布置等都非常diverse,他家中也有瓷器,还有很多印度人送的东西。他娶了个美国人当太太,他家的主流文化还是西方文化。他本人也比较传奇,看得出是个崇尚刺激的人。他有很多赛车服和跑车。
我印象最深的一点,黄教主本人十分平易近人,去他家的时候我还是个学生,他还专门给我开了啤酒,也没有拒绝和我合照。我见过一些亿万富翁,当学生的时候和他们拍照,他们一般会说不合适,或者拍照的时候板着脸,没有他这样随和。
另外就是我们的第一个投资人创新工场的李开复老师。就在最近,刚刚又和他在硅谷度过了充实的一周,还见到了雅虎创始人杨致远,OpenAI的两位创始人,斯坦福、伯克利的知名教授,以及很多科技朋友。还吃到了开复老师亲手做的卤肉饭和牛肉面。和投资人交流是很开心的经历。
“
生活之选:
在花园城市,和所爱的人一起生活
目前,我大部分时间都在新加坡国立大学任教。新国立和伯克利、包括国内清华姚班的教学制度类似,学校很强调每位教职人员的独立性。系主任不等同于我的领导,只要没有学术道德问题,系主任也无权干涉我的工作,这种制度比较有利于科研创新。
工作选择上,我当时也拿了几个美国学校的offer,相较而言新加坡的工作待遇反而更高。之所以最终选择去新加坡,也是因为我是一个注重生活质量的人。在美国,吃一顿中餐要开车好几个小时,而新加坡小而干净,还是华人社会,无论是饮食,还是基础设施各方面,当然和美国相比更适合华人。游玩方面,新加坡市内也有很多自然公园,有很多划船等娱乐设施,也有环球影城,当然更重要的是那一带签证比较方便。从新加坡去普吉岛、马来西亚或者马尔代夫很方便,整体上我对新加坡的工作生活目前来看还是比较满意。
个人方面,我读博期间就结婚了,我虽然今年才31岁,但是我已经有两个孩子。很多人觉得结婚很浪费时间。李开复老师就是一个鲜活的例子,他也读了博士,21岁就结婚了。其实结婚早反而会让人更加专注。我认识的一个同学,因为和女朋友分手,大半年人就很颓废,反而影响到了他很多,毕竟这是我们人生发展必须要做的事情。当然人生的成功可能是由自己定义的,并不是由一些KPI决定的。
当我们为某件事,某个人付出了很多时间和精力,最初的动力是源于我们的在乎,源于最本质的喜欢。我甚至想,不应该过多追求这种人际关系或者恋爱关系中的舒服感,舒服感可能只是持续一段很短的时间,本质的喜欢可能更持久,因为不管和谁结婚,最终都会有遗憾。
就像张朝阳说的,他都是亿万富翁了,还是感觉很焦虑很不满足,因为人类本身就是非常贪婪的。我们人生可能就只有三四万天,有效的生命只有两万天,为什么我们不做一些喜欢的事情(比如说创业)。我觉得不妨大胆地去努力和一个最喜欢的人在一起,这样即便有遗憾,也是值得的。
更多内容 尽在智源社区