打卡智能中国(五):博士都去哪儿了?

news2025/1/16 11:16:40

13a713a1c58f699a91d2631eb8dfd72f.jpeg

《打卡智能中国》系列更新了几期,有读者表示,很爱看这类接地气的真实故事,也有读者反映,不是电工,就是文员、农民、治沙人,人工智能不是高精尖学科吗?那些学历很高的博士都去哪儿了?

答案是:他们在地里,厂里,矿里呢。

中科院的林博士,我见过他两次。

第一次是2020年,某AI精英培训班的开学典礼。当时,林博士对AI的了解,还停留在“深度学习的皮毛”,他调用平台的机器视觉模型,开发了一个识别动物的模型,他说:“可以识别的种类还比较少,我来也想看看其他学员都用AI做些什么工作,跟大家多学习。”林博士那次介绍这个AI产品时,还有些没底气。

第二次是2022年,在一个普通的会议室采访间,林博士的言谈内容,变得自如和丰富了很多。

7e42e518964d20d23d6bc85be3857bb3.png

“之前的那个生物识别应用,这几年已经多出了好多个模型,扩展到了哺乳动物、两栖爬行、昆虫科一级、蝴蝶种一级的识别,”他说,“我们还用AI做了别的事,一个是野外生物的图像采集和自动化识别,一个是通过声纹识别来进行野外动物保护,目前设备已经弄好了。我们还支撑别的企业去做AI商业化应用,比如农业病虫害的识别”。

两年时间,林博士从AI新手成长为AI熟手,也从一个坐在电脑前搞研究的学者,多了很多上深林、下农田的经验。他眼中的AI,倒映着智能中国的上限与纵深。

今天的故事,是科研领域的博士,怎么从零开始用AI、做AI。

研究所里的AI,有什么不一样?

7dc9203f9403f73ae65883647e5211e1.png

科研领域的智能化,与工农商等行业既有相同点,也有不同点。

相同点在于:1.缺人;2.缺数;3.缺场景。

科研领域汇聚了大量高学历人才,但依然缺少能将AI与细分学科相结合的复合型人才。就拿林博士来说,他本身是信息学专业的,因为生物研究要用到计算机分析等信息技术,才加入了中科院下属的动物研究所,对于深度学习、图像识别、声纹识别等人工智能技术,他也要从头学起,迭代自己的知识体系。

此外,研究型机构大多有一定的数据积累,但也分领域、分专业甚至分物种。比如林博士想做的物种识别、鸟类声纹识别等AI应用,很多珍稀动物,别说语音资料,连野外活动的图像,数据库里一共都没几张,而缺少充足的数据,AI很难发挥作用。

a74d8f67571d8f8ba0487590830d5de5.png

还有,科学研究的哪些课题、方向能用到AI,这也是一个需要科学家们发挥“主观能动性”去摸索的东西。林博士提到,很多科学研究中已经有很成熟的计算工具了,要用到AI肯定是要从一线科研人员开始推动,这就需要自己有一定的想法,他说:“所以我听说有这个深度学习人才培训,就带着我的课题主动来报名了,希望能顺利毕业。”

当然,AI+科研也有其特别的地方。

比如,特别没钱途。

第一次见面,我好奇地问,“当下AI跟生物的碰撞多不多?”林博士笑言:

“AI在医学领域应用的很快,但在生物识别方面就没有那么好,可能跟动物保护这种基础性研究的商业价值不大有关系,投入上有一定的滞后性。”

玩笑归玩笑,AI与科研的结合也特别重要。

林博士的经历证明,基础研究领域的AI创新一旦成长起来,可以带来产学研用的一系列联动效应。

2020年,林博士刚刚做出了一款识别动植物的科普类App,集成了计算机视觉技术和他们单位的动植物百科资料,方便一些动物爱好者、野外观测调查员以及小学生和家长们使用。

中国领土广阔,专家考察有一定的时间线,比如每五年一次,很可能就会错失某些物种的观察机会,导致采样到的数据是有偏差的。而且生物领域的分类学家、人才也处于萎缩状态,越来越少人愿意从事这样艰苦的野外工作,所以全靠研究者和野外工作者去采集和分类,是非常不现实的。

通过智能技术的创新应用,聚集起更多数据合作伙伴,发动机构乃至广大用户一起参与进来,对于生物保护和研究的开展很有帮助。

而这样一个纯公益的工作,随后也凝聚起了很多研究机构、公益组织以及企业/产业界的关注。

林博士告诉我,开发完那个App之后,很多类似的国际动物保护机构跟他们建立了很好的联系,他们输出技术,而对方将获取的生物数据资料反馈给他们,让他们获得了几十万的影像数据,其中很多都是新增的观测点位,相当于给国家节省了好多科研经费。

可持续的数据获取机制,对于后续科研任务的开展是非常重要的。

除此之外,他们还吸引到了一些商业化项目方,前来寻求合作。

604d1f7d6a42229dad6a65070e88c3e3.png

比如有企业知道他们有这个技术,找到他们想开发一种害虫识别的系统,恰好林博士所在的单位本身也承担着病虫害防治工作,有做好粮食安全保障的职能。于是双方一拍即合,开始搭建病虫害的数据库,进行识别算法的开发。

相比跟经济价值更近的工农商业,科研领域的智能化看起来好像没那么紧迫,却有着“创新发动机”的作用:影响的不是一个人、一家企业,而可能是一个行业(比如上文提到的农业)、一个群体(比如科普教育)乃至一个国家(比如学科人才建设)。

1c8ec49a07ea75907d8101b093b0ccb6.png

从象牙塔到农田:一个博士的脚步

此前报道中的电力工人、水厂员工都是AI应用末端环节的一份子。

而借助林博士的脚步,我们可以看到,一种AI能力是如何诞生的又如何抵达应用末端。

第一步:从零做数据。

接收到企业提出的识别病虫害的需求之后,林博士发现,数据就是一个很大的挑战。

从生物学的角度,害虫也有很多种,一种害虫的发育过程中还有很多种形态,从虫卵、弱虫、幼虫、成虫的发育状态都不同,在图像分类过程中就属于不同类别,如果是外行人来做,根本做不明白也没有一个成型的数据库。

所以林博士和团队,必须从电脑桌前走到地里,去实地采集不同阶段的图像,确定病虫害不同发育阶段的形状特征,为后续模型的精准识别打下基础。

eb7dc10b60122a05ad28e6f39f6d0bd9.png

第二步:跟农业专家深入交流。

不同地区的病虫害可能并不相同,里面涉及到很多非常专业的知识点,比如北京郊区的番茄有哪些常见的病虫害?发现害虫后会对接怎样的防治措施?提供什么药物?这都要深入到大棚里,跟当地的植保专家以及长期从事一线生产的农民们进行交流,这样才能保证后期打造的AI系统,能够提供从病虫害识别到防治指导的全套工作。

第三步:模型开发与调优迭代。

林博士和同事们基本都是信息学专业,并不是深度学习算法工程师出身,而农业项目的模型迭代又很快,一批图像采集完了之后,马上就要迭代一批模型,为了精准识别不同作物,还要开发不同的模型,这样模型很多,开发和迭代工作量很大。

林博士表示,科研工作中可能很看重AI开发框架的灵活性、可扩展性、先进性等,比如为了发paper便于同行复现,大家更倾向于使用TensorFlow、PyTorch这样的海外平台,而真正在开发产业用模型时,我们更看重的是平台的易用性,以及面向应用的工业化能力是不是很简单易用,有没有已经训练好的性能不错的模型。

因为底层的技术手段、理论方法,国内外开发平台都是一样的,也都是开源的,没什么区别,但容不容易训练,容不容易部署,能不能工业性地批量生产(模型),这些问题的答案对产业智能化很重要。

目前,由林博士及团队支持的该农业病虫害应用已经在北京落地了,这也是北方地区第一款病虫害识别的App。

为什么做这个项目?林博士及团队的出发点和商业公司的想法就不太一样——一方面是企业/农户有需求;另一方面是为了帮助新农人。

“现在大量的新型农业生产者,比如年轻一代,”林博士提到,“他们没有熟练的生产经验,也不依赖上一辈传授的经验,而是更依赖从互联网获取的信息。这时候我们给他提供一个工具——AI识别,慢慢地他们也会成长为有经验的生产者。”

以往《打卡智能中国》的主角,电力工人放飞的无人机,水厂员工日常使用的智慧系统,这些AI工具背后就是无数个林博士。

学员?导师?研究员?开发者?

一个AI人的身份转换

eca6abc673973b7f0b6fef338ce360f8.png

第一次见到林博士,他还是一个带着课题等待被评判的“AI新手学员”。

第二次见到他,已经是国内某AI开源社区的技术专家了。

林博士平时还会承担一些新手指导、开发经验分享等任务,把自己的数据和模型开源放到平台上,让开发者和学生用户有实践和练手的机会。

培养多一点AI人才,这种“利他”的思维,好像就刻在这位学者的脑子里,不用犹豫和思索,自然而然地就去做了。

AI人才需求量大、缺口大,已经是公认的事实,也成为人工智能产业进一步繁荣发展的限制。

a760b0c9bc13daacb3466e8ec065ec16.png

AI人才的培养难,一是因为技术新,相较于理数生化等传统学科,以及计算机这样的成熟学科来说,AI本身是一门新兴技术,还在不断更新迭代,没有完善的人才培养模式和课程体系;二是交叉性强,AI是一门应用型技术,要求跟产业紧密结合、实践落地,仅靠学校教育是无法满足AI复合型人才的培养需求。

十四五规划中提出,人工智能行业要形成产学研用深度融合的技术创新体系,连通企业、高校、研究院所、政府等创新主体。

在AI生态里,“产学研用”是分层的,每一层都承担着各自主要的创新任务,但分层不代表割裂,各层还要紧密联动,拧成一个创新链条。

“林博士们”就成了那个游走在各层的关键角色:

在产业中,他们是AI创新的开发者;

在高校人才培养中,他们是那个给学弟、学妹指导的前辈;

在研究中,他们是将AI技术与科学探索相结合的先行者;

在应用环节,他们会主动去贴近一线使用者,让AI工具能变得更好用。

“谈笑有鸿儒,往来无白丁”这就是今天的AI学人,既有身处象牙塔兼济天下的理想情怀,又有身先士卒深入产业的行动能力。

有一个工业大学的老师曾告诉我,要把AI研究做到工厂里,这和林博士把AI做进农田里,有异曲同工之妙。

这些学者拥抱AI的经历,让我深切的感受到:AI既是一个专业,也不是一个专业。AI将更多专家和学者拉进AI的世界,“产学研用”的闭环加速转动,才能持续打开AI的上限和想象空间。

大鹏之动,非一羽之轻也,多元人才的合力,才能托举起智能中国。

012cc87a46f7f2ae7c563b5676a3f6b7.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/557464.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

用数据讲故事:十大统计学/机器学习魔法指数

统计学和机器学习为数据分析提供理论基础,入门时我看过很多统计学相关书籍,复杂的公式和推导过程让我一度陷入迷茫。对于数据科学/分析师来说,如何使用统计学知识并应用到我们的分析场景中更为重要。本文主要基于数据分析工作中的实际应用场景…

1000本!计算机经典书籍分享

闲话少说,列表如下。 编程语言类书籍 包含:Java、C、C、Python、Go等语言 Java电子书大全https://www.yingyanshe.cn/5275.htmlC电子书大全https://www.yingyanshe.cn/5284.htmlC语言类电子书https://www.yingyanshe.cn/5293.htmlC#电子书https://www…

chatgpt赋能Python-python_fg

Python FG: 优秀的Python工程师一定要知道的资源 如果你是一名Python工程师,那么你一定会喜欢Python FG资源。Python FG是一个在线平台,提供海量的Python API文档、教程、实例、以及与Python有关的各种工具和资源,让Python工程师轻松学习和使…

盘点!Instruction Tuning 时代的大模型

作者 | Kevin吴嘉文 整理 | NewBeeNLP 公众号 https://zhuanlan.zhihu.com/p/616830127 Alpaca,ChatGLM 等模型的效果可以接受,下文总结部分笔记,为训练自定义小型化(7B)模型提供点知识储备。包括模型论文 LaMDA, Mup…

纯净版Win10系统重装教程(超详细)

本博客详细讲解纯净版Win10系统重装,步骤齐全,小白可实操。 纯净版Win10系统重装教程 系统安装前准备下载安装工具更新重装 制作U盘为启动盘 重装Win10进入Boot模式选择系统版本分区系统安装中新系统配置 系统安装前准备 ➢ 准备8G或8G以上的空U盘。&a…

POSTGRESQL 10个使用POSTGRESQL 需要避免的错误 (译)

开头还是介绍一下群,如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,在新加的朋友会分到2群(共…

EOS网络基金会大战Block.One

微信公众号修改了推送规则,请各位亲爱的读者给刘教链公众号添加星标🌟,以便及时收到每日最新文章推送! 星标🌟添加方法:【1】点击标题下方“刘教链 刘教链”的第二个“刘教链”,打开公众号主页&…

chatgpt赋能Python-python_field

Python在Field上的应用 Python作为一门高级编程语言,在众多领域中扮演着应用广泛、易于学习、使用简便、速度出色的角色。在本文中,我们将重点关注Python在Field上的应用。 Field是什么? Field指的是“领域”,包括科学、工程、…

活动报名|分布式人工智能:可扩展性、效率和泛化性

2023年05月25日(星期四)14:00-15:30,智源社区「智源Live 第42期」线上活动将在线举办,「阅读原文」报名即可参加。 活动主题:分布式人工智能:可扩展性、效率和泛化性 安波 安波是新加坡南洋理工大学校长委员…

chatgpt赋能Python-python_for_end

Python for End: 介绍 Python是一种高级编程语言,由Guido van Rossum创建于1989年,并在1991年正式发布。Python是一种多范式编程语言,可以用于面向对象、函数式和过程式编程。它拥有简单易懂的语法以及扩展性强的库,从而使得开发…

见证ES6革命:深入学习let、const、var的区别、解构赋值、箭头函数等常用知识点,开创全新开发模式。

let、const、var的区别 使用var声明的变量,其作用域为该语句所在的函数内,且存在变量提升现象。使用let声明的变量,其作用域为该语句所在的代码块内,不存在变量提升。使用const声明的是常量,在后面出现的代码块中,不能在修改改常量的值。 var let const 函数级作用域 块级…

ThingsBoard教程(五十):规则节点解析 创建关系节点Create Relation Node,删除关系节点 Delete Relation Node

创建关系节点 Create Relation Node Since TB Version 2.2.1 根据类型和方向,从所选实体创建到消息发起方的关系。 以下消息发起方类型被允许:资产、设备、实体视图、客户、租、仪表板。 通过元数据键模式查找目标实体,然后在源实体和目标实体之间创建关系。 如果选择的…

AbstractStringBuilder源码

介绍 AbstractStringBuilder这个抽象类是StringBuilder和StringBuffer的直接父类,而且定义了很多方法,因此在学习这两个类之前建议先学习 AbstractStringBuilder抽象类 该类在源码中注释是以JDK1.5开始作为前两个类的父类存在的 abstract class Abstr…

【已解决】使用selenium启动谷歌Chrome浏览器打开指定网站,页面空白,而使用其它浏览器手动打开该网站则正常

问题描述 1、在使用python实现自动化网络爬虫时,我使用到selenium来驱动谷歌Chrome浏览器来打开某一个网页,然后爬取数据,代码如下: from selenium import webdriver import timedriver webdriver.Chrome() driver.get(https://…

基于JavaSpringBoot+Vue+uniapp实现微信小程序新闻资讯平台

博主介绍:✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

多模态大模型时代下的文档图像智能分析与处理

多模态大模型时代下的文档图像智能分析与处理 0. 前言1. 人工智能发展历程1.1 传统机器学习1.2 深度学习1.3 多模态大模型时代 2. CCIG 文档图像智能分析与处理论坛2.1 文档图像智能分析与处理的重要性和挑战2.2 文档图像智能分析与处理高峰论坛2.3 走进合合信息 3. 文档图像智…

<SQL>《SQL命令(含例句)精心整理版(2)》

《SQL命令(含例句)精心整理版(2)》 跳转《SQL命令(含例句)精心整理版(1)8 函数8.1 文本处理函数8.2 数值处理函数8.3 时间处理函数8.3.1 时间戳转化为自定义格式from_unixtime8.3.2 …

案例17:Java代驾管理系统设计与实现开题报告

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

类的加载过程

一、前言   类加载器的技术 二、类的加载过程 2.1 JVM将类加载过程分为三个步骤:装载(Load),链接(Link)和初始化(Initialize)。链接又分为三个步骤,如下图所示: 装载:…

linux命名管道总结

FIFO&#xff0c;也称为命名管道&#xff0c;它是一种文件类型。 1、特点 (1)FIFO可以在无关的进程之间交换数据&#xff0c;与无名管道不同。 (2)FIFO有路径名与之相关联&#xff0c;它以一种特殊设备文件形式存在于文件系统中。 2、原型 (1)#include <sys/types.h> #in…