2023 和鲸社区年度科研闭门会以“对话 AI for Science 先行者,如何抓住科研范式新机遇”为主题,邀请了多个领域的专家学者共同探讨人工智能在各自领域的发展现状与未来趋势。
闭门会圆桌论坛由和鲸科技联合创始人、执行总裁兼首席产品官殷自强主持,以“AI4S 是否在很长一段时间内,会是少数科研人的‘特权’?”为话题,讨论嘉宾有北京理工大学集成电路与电子学院副教授周治国、北京大学心理与认知科学学院博士后王超名,以及某高端制造企业的刘总。
以下为本场圆桌论坛部分实录整理。
特权?AI 先是工具
殷自强:
如何看待 AI 在各个垂直学科中的发展,我觉得是一个蛮值得讨论的话题。
今天我们的三位嘉宾分别代表了“产、学、研”这三个不同的背景。
AI4S 在接下来一段时间内会不会是少数科研人的“特权”?我先翻译一下,它其实是指现在用 AI 做研究的还只有少部分群体,但 AI 的方法在未来会不会成为一个流行的工具呢,我们先听听周老师的观点。
周治国:
AI 是人类智慧的结晶,我之前和朋友聊天的时候说,我们小的时候有问题问父母、问老师,后来自己看书、查文献,但是现在有更便捷的办法了,就是问 AI。
任何 AI 在它 for Science 之前首先是个工具。
我对工具是非常热爱和感兴趣的,以和鲸为例,我认为工具生产商应该是非常有信仰的,因为工具开发的过程需要吸引更多用户才能解决完美化倾向的问题——这不是件容易的事,需要有信仰的力量;换过来说,工具平台如果想有广大的受众,它一定得是平易近人的。
那特权又是什么呢?是我要让这个东西卖的很贵,让人不能轻易地用到,从而我能获得超额利润;是又想赚你的钱,又不想让你发展——那是卡脖子问题。所以,从工具开发者的角度来说,无论是从产品的性价比也好、产品的开源程度也好,他一定是希望跟大家分享的,做工具的人天然不会产生“特权”这个想法。
殷自强:
感谢周老师,周老师是集成电路的专家,上次我们去实验室参观交流的时候发现实验室里也会用很多新方法。
您刚才说工具的设计者希望的是普及受众,那作为使用者呢?比如您和近两年的研究生,在实际使用 AI 方法的时候,遇到的最大困难是什么?
周治国:
对于我自己来说,最大的困难应该是随着年龄的增长,学习新东西的速度相对来说慢了一些,学生肯定学得比我要快。从工具的使用来说,现在大家日常在做的很多工作都是很“卷”的,像我们的阅卷工作,或者企业里设定的各种 kpi 的工作,所以确实是需要一些小工具让生活更美好起来。
但要做好这件事,第一要求领导层对工具平台很理解、很了解,上层领导需要有意识去推动,这很关键;其次就是我们这种中间层,得要很乐意去做,同时也愿意把做好的小工具分享出去;第三就是工具的受众愿意放心大胆地去使用。所以这里也会涉及到一部分人才培养的问题。
AI 是黑箱?人脑也是
殷自强:
了解,谢谢周老师,那我们再问一下超名兄。
我们知道现在绝大多数 AI 都基于神经网络,超名兄又是做类脑研究的,事实上 AI 的发展与生命科学的研究密不可分,甚至 AI4S 最早出现在大家的视野里就是源于蛋白质结构的那篇论文。我发现最早的 AI 方法,或者说最显著的一些 AI4S 的应用,很多是在生命科学领域涌现的。
关于未来研究者对于 AI 方法的使用,超名兄是如何看待这个趋势的?
王超名:
谢谢自强,我们领域现在是很提倡使用 AI 的方法去研究大脑的工作原理的。
关于今天的主题“ AI4S 会不会成为少数人的特权”,我觉得在目前的阶段可能会,因为这少部分掌握了 AI 方法的同学可以利用 AI 很好地去做一些脑科学的研究,做实验的同学也可以利用 AI 帮助分析实验、对比实验的结果。
人工智能的发展存在一个很有意思的现象是,每当出现了一个最 powerful 的模型,我们就很喜欢拿这个最 powerful 的模型跟人类去比。比如当年 cnn 出来以后,很多人研究说 cnn 与人脑的视觉皮层很像,我们就用 cnn 来研究人类的视觉皮层是怎么工作的;后来 rnn 兴起,也有很多研究者用 rnn 来研究大脑是怎么去做 working memory 或者 decision making 的。
每当一个最前沿的新技术产生,我觉得就应该快速地去学习它并应用到自己的研究中,无论是做计算的还是做实验的,都应该是这样。
殷自强:
明白,那对于科研人员或实验人员来说,AI 技术与其他技术相比,哪些方面比较与众不同呢?
有些人认为 AI 是黑箱,没有可解释性,会对研究造成挑战;也有人说 AI 技术的学习成本很高,所以不愿意用。这些阻碍大部分人接受 AI 技术的门槛在未来会是可解决的吗?
王超名:
我觉得肯定会越来越得到解决,而且从另一个维度看,虽然我们认为 AI 是黑箱,但其实人脑也是黑箱。
为什么我们喜欢用 AI 帮助做脑科学的研究,就像著名的物理学家费曼说的,如果我不能亲手创造它,我就不能理解它。传统大家都用心理学研究人脑,但现在有了 AI ,虽然 AI 是黑箱,但它相较于真正的人脑和生物大脑来说,反而是可操纵的,所以我觉得未来 AI 会越来越多地应用到大脑的理解中。
至于是什么阻碍了 AI 在脑科学领域的应用,除了提到的可解释性很差之外,现在也有另外一种趋势是数据+任务驱动的方法——先把脑科学已有的知识,比如物理的结构、突触的连接,引入到 AI 模型中去,然后驱动它做 task ,再去研究它在这种 physical knowledge-constrained 的模型下是怎么完成认知任务的,这也是目前比较火的方向。
殷自强:
明白,超名兄的观点很有趣,大家觉得 AI 是黑箱不相信 AI 而更愿意相信人的决策,但人的主观决策本身也是黑箱,站在这个视角看,反倒 AI 的一些方法是可检验、可操纵的。
刚才还提到结合物理模型,于峻川老师也有在分享(见文末相关阅读)中说,我们在构建模型时可以把已有的专业知识、物理规律结合在模型中,让它即使是黑箱的 AI 方法但也不会与既有的知识结构相悖,这些方式都会更好地促进未来 AI4S 的发展。
AI 赋能协同
殷自强:
那我们再听一听刘总的观点,从高端制造企业研发的视角,是如何看待 AI 技术的发展与落地的?
刘总:
我们是搞工程的,工程要求的是精确,就是它一定得是可复现的,像 ChatGPT 这样聊天式的、不可复现的 AI 会让大家觉得得出的结论不太让人放心。但工程还有另外一面,就是它需要涉及非常多专业的人共同协作,而这个协作的过程,或者说用传统的方法让上游专业和下游专业相互理解的过程,代价就很高了。
像我们一个项目组可能会有上百位工程师参与其中,如果可以做到把一些需要精确理解的知识、精确计算的知识都封装成一个 api,靠 AI 把每个专业的 api 串起来,这样在很大程度上就能解决专业之间相互协作的问题。它带来的收益也许是非常大的,可以使得整个工程的效率有很大提升。
殷自强:
是的,我们会发现很多垂直领域很难进入的一个原因就是里面有很多 know-how ,以前没有 AI 时只能靠学科专家去做相关研究,但现在这些知识可以被 AI 算法所学习,让其他学科的人能更好地参与至跨学科问题的研究中。
刘总所在的企业应该是少数的会引入各个不同专业的技术人员到公司共同发展高端制造的企业,即使背景各异但也都有机会进入到核心岗位,那有了 AI 以后是不是整个领域都更有可能引入更多其他学科专业的数字化人才,建立更多跨专业的合作呢?
刘总:
是可以的,我们有很多很有经验的老研发人员,从各自过去的领域带来了他们的专业知识,也带来了一些过去可能只在大家脑子里出现过的,但他们已经积累了的算法,我们有时候开玩笑说这些算法是师傅教的“祖传代码”。
那这些积累如何让年轻的一代或是其他专业的人员可以更好地理解呢?你会发现现在如果把一个 MATLAB 的脚本扔给 ChatGPT ,让它翻译成 Python ,它可以做得很好,代码质量是蛮不错的。
所以我觉得,就像这么小的应用,根本谈不上开天辟地的创新,但这样的应用场景非常非常多,如果各个领域都这么去用的话,它所带来的变革就已经是很大的了。
周治国:
我补充一点,因为我本科也是学仪器的,包括亲戚家的孩子我也推荐他们读这个专业。刚才所说的传统的像 MATLAB 这类工具,包括现在的 MWorks ,我们可以称之为“知识 IP”,可以积累、可以复用、能很快上手。
我每年都在观察专业新生,因为是理科所以以前一些老师比较喜欢招男生,但现在女生也非常多了。我发现很多女生很厉害,男生虽然可能主动性强一些,但女生只要有已经架构好的平台,驱动力会更快。所以要求得有打通了内部的数据流、让大家的工具一致化、接口比较方便的平台去使用。
我另外一点感触是现在的人力越来越昂贵了,美国有很多人才引进政策,包括他们特别喜欢做 Github 这种平台,其实就是通过平台收集人类的智慧再复用。国内大家一般比较喜欢各搞一套,属于自我积累,但是积累之后耗散得也快,好比 25-35 岁是研究能力的上升期,再往后虽然有很丰富的经验,但精力可能就没那么旺盛了,那就到达了平淡期或衰退期,这时候更加需要平台集众人之智慧。
降低 AI 应用的门槛
殷自强:
我相信无论是 AI 还是其他技术方法,如果想要更好地普及就必须要解决降低上下游门槛这个问题,平台化是一种手段、封装也是手段。
灵脑科技也有在做 Brainpy ,让用户可以通过类似搭建脚手架的方式去使用 AI 的知识和模型,这样他们就能更好地发挥创造力,这非常重要,这方面超名兄能跟我们分享一下吗?
王超名:
我可以分享一下我们与和鲸合作的两届关于计算神经科学的培训班,每一届都有几百名同学报名,其实也跟这个话题有点相关。
以前很少有这类培训班,我的导师北京大学心理与认知科学学院的吴思教授 2008 年回国后就一直在推动国内计算神经科学的发展,但为什么吴老师之前没有去做这种大规模的推广?其实主要原因还是在于缺乏好的工具。
BrainPy 有一个很重要的优点是它可以帮助大家快速地、轻松地去学习计算神经科学的知识。以前大家的学习可能是拿到一个神经计算的模型后先推公式,再学一番理论知识,但如果没有亲自实践操纵模型,去感受什么样的输入会产生什么样的结果,尤其计算神经科学是用动力学系统建模,没有经常地去“玩”产生直观的认知的话,他是很难理解的。BrainPy 能让同学们自己结合数据操纵模型,就会产生很深的印象。
其实报名我们两届培训班的很多同学都是做实验的,大多没有数理基础,过程中也会产生很多问题,但最终都能跑起来并应用到他们自己的建模中去。所以最重要的还是要提供一个非常简单易懂的平台或系统去辅助他们,这是我通过培训班产生的感触。
殷自强:
了解,报名培训班的学员大家的专业背景情况主要是怎样的呢?经过培训大家真的能掌握那些知识和方法吗?
我对这个其实很感兴趣,包括它也与我们今天圆桌讨论的主题有一定关联。
事实上我以前跟其他人交流接收到的信息是,大多数人对于 AI 就是畏难的,是不敢尝试的。脑科学也是非常垂直的领域,跟 AI 结合起来难度就更上了一个台阶,如果说我们培训班能通过提供工具脚手架让大家在实际实践中确实有收获、新的方法能普及得起来,我相信对于其他领域也会产生很大鼓舞。
王超名:
是可以的,简单来说,很多以前做实验的同学都没有办法去建模,但是培训后他们再遇到问题就会知道该用什么模型去思考和解决。
主要涉及两类背景吧:一类是有些同学会通过模型理解他的实验现象,进而指导实验的进展。比如我们最近在上海神经所交流时,就发现有些上了我们课程的同学已经知道怎么将基本的计算神经科学的概念融入到实验的现象中去,进而指导后面的实验设计了。另一类是用计算神经建模的方式去研究他们的实验问题,这些同学的背景就会比较广泛了,比如学心理学的或者做电生理实验的。
一个明显的现象是大家对于平台和工具都是非常认可的,如果他们确实觉得有用的话。
周治国:
我补充两句,我可能是 BrainPy 的一个潜在用户,因为前两天我们有个同学的癫痫检测刚刚开题。
现在心理学相关的,或者说我们称之为“幸福科技”这块的工作是挺难的,我们现在的问题相当于是数据源没有模型。好比以前做硬件,没有一个开发板都会很痛苦,到后来硬件便宜了,有了口袋实验室就方便了很多,再后来国家推行 i-lab 虚拟实验室,其实都是一样的情况。
我们现在有一个做类似具身智能的实验室,癫痫、脑疾病的数据都很宝贵、很难得到,但如果有虚拟的实验室就会相对比较方便了。再加上 BrainPy 平台,大家就能一起合作,哪怕最开始模型简单一点,但只要开源出来就一定会有人愿意参与,我觉得如果能有这样的交流是特别好的。
殷自强:
谢谢周老师。时间有限,我们今天的圆桌就先讨论到这边,感谢三位嘉宾,分享了很多有意义、有意思的观点。
其实我们今天并不是真的想要去讨论 AI4S 究竟是一个特权问题还是平权问题,相信所有人的目标都是希望能更好地把 AI 引入到自己领域的研究之中,并能更好地落地,希望今天的分享能让大家有所收获。
以上为本场圆桌论坛部分实录整理。
相关推荐:
- 解放军总医院医学创新研究部刘晓莉:基于数据和知识驱动的临床预测模型的构建
- 北京大学王超名:BrainPy,迈向数字化大脑的计算基础设施
- 中国自然资源航空物探遥感中心于峻川:“AI+遥感”技术地学应用实践与展望
如果您对本次闭门会中专家们分享的工具、技术感兴趣,欢迎点此链接联系工作人员获取更多报告和资料。
您也可以点击此处免费体验了解与众多高校、科研单位合作的数据科学协同平台 ModelWhale。