谈谈一个IT杂家的职业生涯规划,你的护城河被AI 攻破了么

news2024/11/25 1:41:40

文章大纲

  • 没有顶会的从业者:成为深度学习老中医
  • AIGC 还未能克服的难点:忽然的惊喜 -- 大模型的智能涌现
  • 未来还能做点什么,从计算机视觉的发展走向看
    • T 字型人才与护城河
    • 成为更加熟练使用人工智能的人
  • 参考文献与学习路径


我的职业生涯将近十年,经历丰富。确切来说是广度足够,工作过的公司涵盖,民营小企业,外包,研究所,初创,世界五百强的外企。

而且干过的技术项目也挺广,因此自称个杂家不算过分。但杂家自然对技术变化的嗅觉更加敏锐,时常担忧某项技术的演变是否在未来保持活力。

最近在各处,比如知乎,csdn 等都看到很多,询问职业生涯规划等的帖子。我的想法和精力应该足够有代表性,至少大部分没有工作过我这么多类型的企业。我的研究生同学毕业后,4个人,3个到现在都没换过工作,只有我换过7个【算上实习就是8个】,他们都是足够专一的人,哈哈。


没有顶会的从业者:成为深度学习老中医

如果你还没有顶会文章,那你目前还不算是top level 的机器学习从业者。当然,即使有了顶级会议很多项目还是非常不好做,不一定能拿的下来。世界是变化的,数据是变化的,几百亿,万亿的参数能拟合时刻变化的现实世界吗?

Facebook公司的人工智能研究专家莱昂·博托(Léon Bottou)曾在2015年国际机器学习会议(ICML)上发表演讲——《机器学习的两大挑战》。在他看来,AI给软件工程带来了新的混乱,因为生产环境下数据必然会发生变化,会使AI模型或算法无法按预期输出稳定的结果。如果把训练好的模型作为软件模块来集成,模块的输出会受输入数据分布的变化影响,不能按模块之间的合约(Contract)“办事”,从而造成其他模块无法正常工作。

并且,AI模型什么时候、什么情况下会“违约”,无法被预先界定。传统软件工程中靠抽象封装解耦来解决大规模系统复杂度的问题,而这其中最关键的模块合约,被AI这个“捣乱”分子破坏了。模块之间的弱合约会带来“抽象泄露”(Abstraction Leak),不可依赖的子系统会让整个系统崩溃。因为数据必然会发生变化,所以模型无法按预期输出稳定结果。数据为什么会变化?发生变化之后又该怎么办呢?在真实的AI行业项目中,数据在不同客户项目和同一客户项目的不同阶段,都会呈现出不同的面貌,从而影响算法网络结构设计和模型参数设定。“做AI项目,客户第一次会提供一小撮数据样本让你理解业务数据;等你入场做POC测试时,会拿到批量的真实历史数据;等项目上生产环境后,你会碰到更实时的数据;等运行一段时间后又必然会遇到各种新的情况,例如调整客户业务的人群定位、外部行业政策有变导致业务环境也发生变化,等等。在这四个不同阶段,你所认知的客户数据特点和分布都会发生变化,而这个变化就意味着超参数要重新调整、网络结构可能要重新设计甚至对算法进行重新取舍……没办法,这就是做AI行业项目的命,很麻烦,也很折腾。”——某大厂AI算法工程师“很折腾”——更要命的是“折腾”的时间、地点、人物:是长期的折腾而不是一次性折腾;要在客户现场折腾而不是远程的云折腾;得让有AI炼金经验的算法工程师而不是普通工程师去折腾。关键是,折腾完了能不能成,怎么折腾才能成,即便是AI业界最顶尖的科学家也没法判断,因为没人知道其中的运作原理。2017年底,在AI界顶级的神经信息处理系统大会(NIPS)上,“时间检验奖”(Test of Time Award)的获得者阿里·拉希米(Ali Rahimi)在一片掌声中登台讲演,在讲完他的获奖论文之后,拉希米在大屏幕上出人意料地放出了一页:炼金术(Alchemy)。

在这里插入图片描述

拉希米将当时快速发展的机器学习(主要指深度学习)比作炼金术,即方法虽然有不错的效果,但缺乏严谨完备可验证的理论知识,业内人士根本不理解自己做的东西是怎么运作的。例如,不小心修改一个参数就会带来模型效果天翻地覆的变化。或者,极简两层线性网络中遇到的问题,在增加网络复杂度之后就奇怪的消失了,没人能说清为啥会这样。深度学习社区对问题的解决方案,往往是在原本很神秘的技术栈上再叠加一层神秘的技巧。就像业界都知道,批量归一化可以降低内部协变量偏移(ICS),从而加快模型训练速度。但是,似乎没人知道为什么降低ICS就能加速训练,也没有证据证明批量归一化就一定能降低ICS,甚至整个业界都缺乏对ICS的严格定义!拉希米说,自己虽然不懂飞机的飞行原理,但他不怕坐飞机,因为他知道有一大批飞机专家掌握了原理。深度学习界最让人担心的是,他自己不知道原理,而且他知道其他人也不知道(参见下图)。

在这里插入图片描述

图 如何对付AI系统的错误图片来源:Randall Munroe,XKCD。

拉希米把这次大会变成了AI界的吐槽大会,在AI社群中引起了不少共鸣,以至于惊动了深度学习界的大佬,包括后来获得了图灵奖的杨立坤(Yann LeCun)。杨立坤对此回应道:神经网络确实没法在理论上证明自己一定收敛,但我们在实践中效果很好,千万别因为深度学习的理论跟不上实践就对AI大肆批判,这就像把孩子跟洗澡水一起倒掉,是不可取的。杨立坤的回应虽然在为AI辩护,但实际上承认了拉希米指出的问题——深度学习的理论不完备,算法模型的运行机制也不可知。因此,在AI行业项目中,不同客户环境下针对模型的调试优化能不能成功,靠的是经验加运气,调对了不知道为啥对,错了也搞不清为啥错,这样的经验自然也就不容易被传承和复制,只能依赖做过多个项目、遇到过多种情况、调试成功和失败的经验都积累了很多的AI“老中医”,这些老中医很稀缺,自然也很贵。而初级医师(有知识没经验的AI博士)要想成长起来,除了有老中医手把手指点,同样要走一遍师傅之前的路,靠项目和悟性不断积累“望闻问切”的经验。

因此,想要将AlphaGo的成功转变成其他行业的成功并不容易。想要从一个项目当前的成功迈向另一个项目的成功,也需要面对高额的成本和巨大的风险。这一轮深度学习完美叙事中“业务可复制”的理想,被现实残酷地打破了。

在AlphaGo兴起的那个年代,著名AI科学家吴恩达(Andrew Ng)曾经给出这样的期许:“如果普通人能在不到一秒的时间内完成某一项脑力工作,那么我们很可能在现在或不远的将来用AI将其自动化。”考虑到当时的实践经验,现在或许可以将其改为:如果普通人能在不到一秒的时间内完成某一项脑力工作,那么我们很可能在现在或不远的将来用AI将其自动化,至少可以找到一个符合条件的客户,把我们最贵的算法“老中医”砸进去,做一个能发公关宣传的样稿出来。


AIGC 还未能克服的难点:忽然的惊喜 – 大模型的智能涌现

涌现这个词其实不难理解,尤其是养过小孩的人。

忽然有一天,你的小孩学着妈妈的样子,会了叫你的名字,说:xxx 把水给我!

我想你一定不会生气,反而会非常惊喜。这样的场景很类似智能的涌现。

人类面对从未遇到过的问题就会涌现,但。。。

大模型许多新技能的泛化被解释为涌现,而涌现又是不可预测、不可控制的,那也就很难蓄意产出新技能的涌现了。某种程度上,大模型还是继承了深度学习炼金的特点啊。

这个涌现啊,就像凯文·凯利《失控》写过的,群集智能系统因为独立、不可控,才产生了智能的突破,所以要想有突破,就要放弃以往所习惯的中心控制,要接受不可预测、不可控制的这种失控。但是,如果社会还是不习惯这种失控,大众预期就会跟着舆论情绪走,要是因此高估了短期表现,就有可能因为暂时受挫看衰长期,这种震荡对产业发展其实是不利的。”小柯:“现在确实有一些声音,对大模型泛化的边界和程度有比较乐观的预期。前段时间,斯坦福和哈佛有人在《自然》(Nature)杂志上发了关于大模型通才式医疗AI范式的文章,他们认为不需要人工标签,就能让医疗AI从医学文本扩展到影像和视频了。但实际上,要达到这样的程度,大模型还要有技术突破,学到新的技能才行,而这都是不可预测、不可控的。”

AlphaGo年代对于业务可复制、模型可泛化的过度乐观,在大模型这波技术浪潮中会重演吗?大模型比AlphaGo更接近通用人工智能AGI吗?泛化能力:在从未碰到过的新情况下,AI能够正确理解并执行适当动作的能力。在同样的数据集训练基础上,泛化能力越强,就越能适应新的条件和场景,从而解决更多种类的问题。从技术和商业来看,泛化有两个层次:1.针对某个功能,在A数据集上进行的训练,在数据特点和分布不同的B数据集上表现也不错。这意味着,将模型和对应产品复制到新客户环境的边际成本很低,可加强业务在同一行业、同一场景下的可复制性。2.并未针对某个功能进行数据准备和训练,却学会了该功能(例如英汉翻译)。通过监督微调,甚至上下文学习就能掌握新技能。这意味着,同一个模型提供新的功能、产生新的业务价值的边际成本很低,可提高新产品新业务扩展的可行性和效率。跟AlphaGo和以往的深度学习模型相比,大模型在泛化能力上有了新的突破,因为大模型通过大量数据的预训练、更深的层次和更多的参数,学习并内置了关于世界的知识,从而在一定程度上支持了以上两个层次的泛化。用伊利亚的话说,当GPT训练自己预测下一个字的时候,其是在学习“世界的模型”,是通过学习语言文本的统计相关性来将文本中关于世界的知识压缩到模型中。基于这样的规模效应,大模型确实涌现出了许多泛化能力,体现了一定程度的通用性,但离真正的AGI(按伊利亚的标准,其泛化能力应达到人类大学本科生的水平)还有距离。

■纯文本信息还不足以建立完整的世界模型。目前的大模型在文本学习上有突破,图片学习效果还有待验证,而视频学习则可能要引入Transformer模型之外的新技术。
■大模型的泛化能力是有边界的。当前大模型从文本中学到的能力主要集中在自然语言相关的认知智能领域,而在以图像识别为代表的感知智能和以用户行为预测为代表的决策智能领域,大模型则未必适合。即便在认知智能领域,其也存在规划能力不足等一系列缺陷。
■在自然语言相关的认知智能边界内,泛化的产生是被动的。从涌现机制的角度看,只能通过事后观察来分析浅层的规律,无法做到新技能涌现的可知、可预测、可控,也就很难提升新技能涌现的效率。

在AI新技术产生突破的早期阶段,学界、产业和资本可能有意无意地对模型泛化和业务可复制、可扩展产生乐观预期。例如2023年4月斯坦福和哈佛学者在《自然》杂志发表的文章中,基于大模型提出通才式的医疗人工智能范式,认为无需特定的人工标签训练,即可从文本扩展到医学影像和视频的理解和辅助诊断。然而,文章中并未提到的是,要真正达到这样的范式转变的水平,实际上还有很长的路要走;而且,所需要的技术突破或涌现仍然是不可预测、不可控的。就像凯文·凯利在《失控》一书中讲述的群集系统智能那样,失控(不可知、不可预测、不可控)既是智能获得突破的重要原因,又是智能突破所不可避免的伴生结果。然而,这种失控并非社会所习惯的模式。如果没有合理地控制预期,大众往往在短期过度乐观,一旦受挫,便会低估长期发展趋势,造成产业的大起大落。

从产业的角度,对大模型在各行业场景下的泛化和复制能力,建议“小马过河”,谨慎乐观(参见图4.44)。单纯地期待涌现不可靠,产业界需要找到配套的方法,让大模型落地的结果更可控。[插图]◎图4.44 大模型面对落地行业的选择图片来源:作者使用AI制图软件绘制。1.选好做什么,不做什么。在一些场景中,大模型现有的一些缺陷对商用的影响没那么大,甚至可能是助益,如强调个性化和趣味性的聊天应用的character.ai的创始人说:“我并不认为幻觉是需要解决的问题,我甚至很喜欢它,这是模型有趣的特点。”在character.ai做的“角色扮演”聊天场景中,幻觉是想象力的源泉。但对另一些容错很低的行业,如医疗诊断、自动驾驶、工业自动化,幻觉却危害显著。2.通过人工或机器手段来给大模型的缺陷打补丁。在适合使用GPT大模型能力的领域,针对幻觉、规划能力不足、缺乏长期记忆等缺陷,现在都有部分解决方案。机器手段包括通过本地数据库查询的方式,在对话中带入历史记忆,增加模型的记忆能力,通过两个模型间左右互搏的方式识别幻觉。人工手段包括通过提示工程指引大模型进行复杂规划,采用人工审核的方式来发现并纠正模型幻觉。以上手段在不同行业场景、不同数据环境下的效果与成本,需要用实践验证,其综合结果会影响GPT大模型在这个行业或场景的商业价值。3.针对目标行业进行深入定制化,对快速颠覆怀有谨慎期待,对额外的成本有预期。由于大模型仍无法通吃所有行业,越来越多人意识到,在通用大模型之上,还可以针对垂直领域精细化训练和定制大模型,这类模型仅在指定行业场景下执行有限种类任务,规模可适当缩小。从轻到重,做定制化的方式有:

■基于已有闭源大模型的API接口,通过应用级的微调和打补丁做定制应用。
■选择开源的、已经完成预训练工作的基础模型,做更多定制。
■从头自己训练垂直模型:从预训练数据选择、模型结构设计切入,定制全新大模型,以解决特定行业场景的问题。如彭博推出了500亿参数的金融垂直大模型BloombergGPT,预训练使用的金融数据集和通用数据集各占一半,在金融特有任务,如在新闻情感分析领域领先于通用大模型。

越重的做法,成本越大,壁垒也越高。不同行业,怎么做最有竞争优势,没有标准答案,但可以有一个大致的决策模型:更稳的选择是先做最轻的打补丁,在掌握问题和数据、验证业务价值后,再决定是否走彻底定制路线。然而,这种做法可能错过时间窗口,导致追不上行业里更早做出垂直模型的公司,后者可能更快形成数据反馈到模型能力迭代的“数据飞轮”,与其他人拉开差距。更大胆的方式是跳进选好的方向,直接从头一边炼大模型一边找业务价值,这需要持续的资源,也是目前一批融资能力最强的创业者的共同选择。


未来还能做点什么,从计算机视觉的发展走向看

我算是搞过机器学习的两大领域,NLP 和CV , 可以说 GPT3.5 出来后, NLP 死了,CV 还能活几天估计也不远了,因为目前还有个开放域的自动驾驶没有能搞特别好的解决。我认为CV 以后的研究和应用热点 会集中在下面两个方面:

  • 自动驾驶
  • 深度学习大模型边缘端的部署及推理优化

OpenCV 5.0 还没问世,更新不过来了给大家发了一封邮件立面写到:

In a world where massive AI projects are closed-source, and a handful of companies are set to control the future of AI, people are rightfully asking, where is OpenCV 5? The good news is we have the answer: at the end of this campaign. OpenCV is used everywhere, but as an open source library operated by a non-profit funding has become more and more difficult to come by. If you’ve benefitted from OpenCV in your career or education, please consider supporting the library today and helping ensure the future of this iconic toolset.

这里面第一句话,我认为非常有深度:
在一个大规模人工智能项目是封闭来源的世界里,少数公司将控制人工智能的未来!

T 字型人才与护城河

从某种意义上说,目前的知识分享领域的博主都是在用 自己个人的力量在对抗人工智能。下面是我制作的两个数字人,我甚至连稿子都是AIGC 写的。

数字人-王大力精讲:《机器学习与深度学习》

数字人-王大力精讲: 视频分析 VideoAnalytics

我还在不断思考,在特定领域中,如何不被 大模型所取代。程序员这个职业还能干几年,领域常说成为T字型人才,这个深度就是护城河,目前来看大模型的深度越来越深。。。

成为更加熟练使用人工智能的人

不过也不用那么担心,不要担心人工智能会取代你。

也许取代你的,不是人工智能,而是比你更会用人工智能的人。


参考文献与学习路径

  • 《大模型时代:ChatGPT开启通用人工智能浪潮》

    OpenCV5 的活动:

  • https://www.indiegogo.com/projects/opencv-5-support-non-profit-open-source-cv-ai#/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1209591.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【多项式回归】拟合有噪声的正弦曲线

先导入模块并创建数据: from sklearn.preprocessing import PolynomialFeatures as PF from sklearn.linear_model import LinearRegression import numpy as nprnd np.random.RandomState(42) #设置随机数种子 X rnd.uniform(-3, 3, size100) y np.sin(X) rnd…

飞书开发学习笔记(六)-网页应用免登

飞书开发学习笔记(六)-网页应用免登 一.上一例的问题修正 在上一例中,飞书登录查看网页的界面显示是有误的,看了代码,理论上登录成功之后,应该显示用户名等信息。 最后的res.nickName是用户名,res.i18nName.en_us是英…

冲击900亿美元估值!邀约路演、秘密交表的Shein上市有望

双十一的狂欢刚刚结束,Shein即将赴美上市的消息又在电商圈里投下一枚重磅炸弹。 继被媒体曝光其寻求900亿美金估值后,最新的消息称其已邀请投资人参与路演,且已秘密完成交表。这个神秘的中国独角兽,离敲钟登陆美股的日子越来越近…

爬虫----robots.txt 协议简介

文章目录 robots.txt 是一个用于指示网络爬虫(web spider或web robot)如何与网站上的内容进行交互的协议。这个文件被网站管理员放置在网站的根目录下,用于告知爬虫哪些部分的网站是可以被抓取的,哪些是不被允许的。以下是 robots.txt 协议的一些关键要点: 控制爬虫访问:…

“技能兴鲁”职业技能大赛-网络安全赛项-学生组初赛 WP

Crypto BabyRSA 共模攻击 题目附件: from gmpy2 import * from Crypto.Util.number import *flag flag{I\m not gonna tell you the FLAG} # 这个肯定不是FLAG了,不要交这个咯p getPrime(2048) q getPrime(2048) m1 bytes_to_long(bytes(flag.e…

MHA的那些事儿

什么是MHA? masterhight availability:基于主库的高可用环境下,主从复制和故障切换 主从的架构 MHA至少要一主两从 出现的目的:解决MySQL的单点故障问题。一旦主库崩溃,MHA可以在0-30s内自动完成故障切换 MHA使用的…

毫米波雷达模块的目标检测与跟踪

毫米波雷达技术在目标检测与跟踪方面具有独特的优势,其高精度、不受光照影响等特点使其在汽车、军事、工业等领域广泛应用。本文深入探讨毫米波雷达模块在目标检测与跟踪方面的研究现状、关键技术以及未来发展方向。 随着科技的不断进步,毫米波雷达技术在…

深入解析 Azure 机器学习平台:架构与组成部分

Azure机器学习平台是Microsoft Azure提供的一种云上机器学习服务,为开发者和数据科学家提供了一个全面且易于使用的环境来创建、训练、部署和管理机器学习模型。本文将对Azure机器学习平台的基本架构和组成部分进行深入解析,帮助读者全面了解该平台的工作…

10-18 请求与相应1

前后台联调 前台通过一个表单, action写的servlet绑定的url,提交表单,请求我们servlet的doGet()/ doPost()方法 问题: 1.后台怎么获取前端的提交,请求的数据?底层:TCP通信,socket的得到输入流,读取数据 2.后台处理请求之后,怎么把结果给到前端?底层:TCP通信,socket的得到输入…

VR全景:打造虚拟政务服务,打通服务群众“最后一公里”

大家对政务大厅的工作效率可能已经司空见惯,办事窗口少,而需要办理的群众和业务却很多,很多去政务大厅办理业务的,排队几个小时也是常有的。并且在传统政务服务中,办事流程一般都较为复杂、耗时长,往往需要…

TSINGSEE视频汇聚管理与AI算法视频质量检测方案

一、建设背景 随着互联网视频技术的发展,视频监管在辅助安全生产、管理等方面发挥了不可替代的作用。但是,在监管场景中,仍然存在视频掉线、视频人为遮挡、视频录像存储时长不足等问题,对企业的日常管理和运转存在较大的安全隐患…

uniapp插件开发

安装android studio:安装目录下bin下的此文件,是用来修改分配给android studio的占用内存。 Android 11足够用。 创建新项目: 目录结构介绍: UI组件介绍:在设计程序界面时可以使用可视化拖拽的方式,没有必要…

DGL如何表征一张图

有关于DGL中图的构建 DGL 将有向图表示为一个 DGL 图对象。图中的节点编号连续,从0开始。我们一般通过指定图中的节点数,以及源节点和目标节点的列表,来构建这么一个图。 下面的代码构造了一个图,这个图有五个叶子节点。中心节点…

03 # 类型基础:动态类型与静态类型

通俗定义 静态类型语言:在编译阶段确定所有变量的类型 编译阶段确定属性偏移量用偏移量访问代替属性名访问偏移量信息共享 动态类型语言:在执行阶段确定所有变量的类型 在程序运行时,动态计算属性偏移量需要额外的空间存储属性名所有对象的…

246:vue+openlayers 绘制多边形,drawend获取最大幅宽

第246个 点击查看专栏目录 本示例是演示如何在vue+openlayers项目中绘制多边形,drawend获取最大幅宽。这里利用turf的turf.distance和openlayers的getExtent获取坐标值。 距离赤道越近,幅宽会越大一些,这里面利用了Math.abs来做绝对值的判断处理。 直接复制下面的 vue+open…

HBase学习笔记(3)—— HBase整合Phoenix

目录 Phoenix Shell 操作 Phoenix JDBC 操作 Phoenix 二级索引 HBase整合Phoenix Phoenix 简介 Phoenix 是 HBase 的开源 SQL 皮肤。可以使用标准 JDBC API 代替 HBase 客户端 API来创建表,插入数据和查询 HBase 数据 使用Phoenix的优点 在 Client 和 HBase …

docker-compose 部署 MySQL 8

前言 Windows 系统通过 docker-compose 部署 MySQL8.0。 MySQL 配置文件(my.cnf) # 服务端参数配置 [mysqld] usermysql # MySQL启动用户 default-storage-engineINNODB # 创建新表时将使用的默认存储引擎 character-set-serverutf8mb4 # 设置mysql服…

科研学习|科研软件——有序多分类Logistic回归的SPSS教程!

一、问题与数据 研究者想调查人们对“本国税收过高”的赞同程度:Strongly Disagree——非常不同意,用“0”表示;Disagree——不同意,用“1”表示;Agree--同意,用“2”表示;Strongly Agree--非常…

从0到0.01入门 Webpack| 002.精选 Webpack面试题

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云…

基础课1——智能客服的定义

1.介绍 智能客服是一种采用人工智能技术的客户服务方式,它通过语音识别、自然语言处理、语义理解等技术,实现了与客户的自动交互。智能客服可以提供客户24小时不间断的服务,帮助客户快速解决问题,提高客户满意度。智能客服的应用…