All in AI,现在开始算不算太晚?

news2025/1/17 8:59:06

编者按:目前大模型近乎可以帮助人类处理方方面面的事情,如对话、写文章、写代码等等。在大模型“狂飙”趋势下,想要从事AI领域的小伙伴可能会犹疑:现在进入AI领域会不会已经太晚了?

本文作者结合自身转型经历和对AI市场的研判,阐述了进入人工智能领域从来都不会太晚,There’s no time like the present

本文还详述了,在“AI渗透一切”的时代,如何快速掌握必要的AI知识,以及如何在AI时代找到自身职业定位。

以下是译文,Enjoy!

作者 | swyx

编译 | 岳扬

我的一位开发者朋友最近跟我说:“如果我现在是20岁,我会放下一切 all in 人工智能。”但他已经花了十多年的时间去学习专业知识、积累社交人脉和良好的声誉,已经达到他目前所在领域的最高水平。因此,他现在还得留在原来的领域。另一位较年长的大学时期朋友是一家上市科技初创公司的高管。他对现在的工作得心应手,拥有近乎完美的简历,他之前的职业经历也是令人羡慕的岗位。然而,他现在正在转变方向,因为正如他告诉我的那样,“生命是短暂的”,他不想在结束时想 “如果当时…”。

最近几天,我同从事技术工作和非技术工作的朋友都有过类似上面这样的对话。虽然我很想让这篇文章关注具体的技术发展和分享飞速发展的最新技术,但我认为有必要花一期来讨论职业转型话题,因为这正是我凑巧特别有资格能够讨论的话题。

01 三十多岁时的转折期

我还记得在我30岁第一次进行职业转型时有多么可怕,当时我已经在金融行业工作了6-7年,我从16岁起就一直想要从事金融行业,穿梭于世界各地,向CEO们提问,并帮助管理一家世界顶级对冲基金的10亿美元资产。看起来我很厉害,但我深知我的内心并不满足,这不是我的最终目标。与从无到有创造出一些东西相比,让一些捐赠基金和养老金的数字变得更加大,就显得微不足道了。我决定从金融行业转向软件工程(和开发者关系) 。接下来发生的大家都已经知道了[1]。

六到七年后,我又一次转变了我的职业。我认为从软件工程师(SWE)到人工智能(AI)的转变几乎和从金融到软件工程师的转变一样大,它们只是表面上看起来相似(都是计算机领域),但是需要大量的新知识和实践经验才能使工作变得有效率。我的转变策略和上次一样:尽可能开始的六个月每个晚上和周末学习,以确保我对要进入的领域拥有浓厚的兴趣(注释1,文末有解释,后同),而且我能够取得有意义的进步,然后就开始与过去say goodbye/破釜沉舟/全力以赴,并告诉大家我进入了这个领域[2](注释2)。

但那只是适用于我自己的情况。每个人的情况可能都会不同。我相信如果你愿意,可以找到如何做到成功转行的方法。这篇文章面向的对象是那些想要获得足够自信去做出决定的人。

我认为,在科技职业的选择中存在很多隐藏的年龄歧视(ageism)和沉没成本误区[3](sunk cost fallacy)。因此,以下是我快速列出的一些理由,可以说明你不会因为年龄问题而无法转行

02 哪怕你年龄已经很大 仍应进入AI领域的原因如下

2.1 人工智能极大的潜力/发展速度

  • 杰夫·贝索斯(Jeff Bezos)在30岁时辞去金融工作,创办了亚马逊。
  • 他这样做是因为1994年互联网使用量每年增长2300%。
  • 通用技术[4](general purpose technologies)(注释3)的推广需要数十年的时间。
  • 想象一下,如果你可以在2000年或2010年成为技术领域的“后浪”,却得出结论认为“为时已晚”而没有进入互联网行业。
  • 自1月以来,ChatGPT的使用量增长了1000% [5](注释4)。

2.2 上手AI需要的时间比我们想象的要短

  • 如果不是通过获取博士学位的路径进入机器学习领域,需要先参加 Andrew Ng (吴恩达)在 Coursera 上的课程[6]三个月左右,然后就会意识到仍需要数年的自学和实践经验才能在机器学习领域做出有趣的事情。
  • 但目前我们掌握生成式AI的学习路径正在变得越来越简单。(注释5)
  • Jeremy Howard 的 fast.ai 课程[7]从 2016 年开始就宣称让学生在七周内进入人工智能领域。到了 2022 年,他已经通过十节 90 分钟的课程带领学员重新实现 Stable Diffusion[8]。Suhail Doshi 在 2022 年 6 月参加了这门课程,到了 11 月就推出了 Playground.ai[9]。
  • 这在一定程度上是由2017年推出的Transformer架构推动的,自那以后它几乎进入了每个 AI 领域[10],并提供了一个强大并且灵活的 baseline,从而使之前的架构知识变得可有可无。因此,没有数十年的研究需要学习,只需要学习最近五年的内容

图片

https://www.stateof.ai/2018

  • 有一些读者询问了关于AI涉及到的数学问题。AI 是否“只是使用了矩阵乘法(matrix multiplication)” [11]存在争议,如果你愿意,可以在大学线性代数和微积分课程中学习矩阵乘法,但我的回答是你不必这样做,现在的那些AI开发框架(比如 Pytorch) 可以帮助你进行任何反向传播(backpropagation)和矩阵操作(matrix manipulations)。
  • 当然,走捷径并不能让你变成能够推动技术发展的博士。 但看看最顶尖AI研究员的职业生涯,你也可以了解需要多长时间才能达到最高水平。Yi Tay 在 Google 贡献或领导完成了许多最新的 LLM 成果,但你可能会惊讶地发现他才获得博士学位约 3.3 年的时间。Ashish Vaswani 在发表 Transformer 论文时距离博士毕业也只有 3 年,而 Alec Radford 发表 GPT 和 GPT-2 论文时刚本科毕业 2 年。
  • 类似这样的职业轨迹在物理、数学、医学等更成熟的领域不会发生,因为它们的 “FOOM(Fast Onset of Overwhelming Mastery) ” 年代[12]已经过去了几个世纪,而 AI 的“foom” 正在明显地发生。
  • 这些话都是为了说明:这仍然是一个非常年轻的领域,在20年后,没有人可能会关心你觉得自己“晚入行”。

2.3 除了成为专业的机器学习领域的研究员,还有许多领域可以选择

  • Prompt和大模型能力研究: Riley Goodside[13] 的职业生涯在 2022 年急剧变化,通过在推特上发布GPT-3的使用技巧,他从 Grindr 的数据科学家变成了世界上第一位高级Prompt工程师[14],他还发现并普及[15]“提示注入(prompt injection) ”这种重要的 LLM 安全问题。自那以后,许多人已经意识到寻找 GPT-3 和 GPT-4 的有趣使用案例在社交媒体上很受欢迎。
  • 软件工程领域: 最近,Whisper.cpp 和 LLaMA.cpp 激发了许多人对在用户终端上运行大型模型的兴趣[16]。我听了 Georgi Gerganov 在 Changelog 上的采访[17],并得知他在 2022 年 9 月自称“非 AI 信仰者”,只是为了好玩而将 Whisper 移植到了 C++。LLaMA.cpp 的发展速度比 Stable Diffusion 还要快[18],而 Stable Diffusion 已经是有史以来增长最快的开源项目之一[19]。尽管没有进行模型训练,但 Georgi 的软件工程专业知识使得这些基础模型更加易于接入。Harrison Chase 的 Langchain[20] 通过构建首个面向所有开发人员的提示工程框架,将Prompt和软件的改进融合到预训练的LLM模型中,吸引了大量关注。从 Guardrails 到 Nat.dev 的一系列 LLM 工具都有助于弥合这些模型从学术界到商业应用的差距。ChatGPT本身在很大程度上是与GPT 3.5系列模型一起交付的用户体验创新,这对前端/UI开发者来说是个好消息。
  • AI技术产品化: 说到 Stable Diffusion,Emad Mostaque 直到 2019 年都是一名对冲基金经理[21],似乎除了为他的儿子进行“literature review of autism and biomolecular pathway analysis of neurotransmitters[22]”相关的研究之外之前并没有任何 AI 经验。但他在 2020 年参加 EleutherAI 社区后意识到 Stable Diffusion 这样的东西是可能存在的,并找到了海德堡大学 CompVis 组[24]的 Patrick 和 Robin[23],提供了大约 60 万美元来训练和交付了2022年第二或最重要的AI产品。没有人想去审查谁做了什么,但一个前对冲基金经理通过发现机会并将财务(和组织架构)杠杆应用于时机已到的想法(ideas whose time had come)而获得大量回报是有道理的。Nat Friedman 已经公开表示,多年的研究造成的能力过剩[25]还没有被足够多的创业公司消化,看起来像 Dave Rogenmoser 这样愿意早早跳上这班车的创业人,在两年内将 Jasper 的 ARR(会计收益率) 从零增长到了 7500 万美元[26],将会获得不成比例的回报。

现有企业和各个垂直领域的创业公司都在拥抱人工智能,这表明未来将是“AI渗透一切”的时代,因此理解基础模型可能是达到目的(利用它们)的一种手段,而不是目的本身(训练模型或对安全性和感知能力进行思考)少想一点你自己和你未来的潜在方向,不是“转行研究AI”,而是在你已经感兴趣或精通的领域 “学习如何利用它”。

我最后一个与年龄相关的呼吁是通用的——挑战自己对大脑是有益的。人们普遍认为神经可塑性(Neuroplasticity)在25岁以后就会停止,但这是有争议[27]的。更为广泛的共识是,持续学习有助于建立认知储备(cognitive reserve) ,有助于避免像痴呆和阿尔茨海默病这样的恶性神经退行性疾病。

你是否正在处理任何类似于了解AI的工作,并想方设法将其运用于实际应用中的挑战?

03 我是如何学习人工智能的

我已经完成了fast.ai的课程内容,但也在持续关注我自己筛选的Twitter列表中的从业者[28],并将笔记放入我的公开地GitHub AI仓库[29]和Latent Space Discord中[30]。大多数比较重要的新论文 在它们被发布的那周我就开始阅读,我还尽可能地运行获得很多点赞的项目和产品的代码或阅读它们的代码。我们即将在播客上发布“Fundamentals 101”系列内容,其中包括AI基础知识,这迫使我去论文并了解一些我们今天认为理所当然的事情的历史(注释6)。

图片

https://github.com/sw-yx/ai-notes/blob/main/Resources/Good%20AI%20Podcasts%20and%20Newsletters.md

注释:

  1. 在两次职业转型中,我都并不是从零开始 - 我在13岁时就接触过BASIC编程,在26岁时作为期权交易员工作时,写了一些极其简单的自然语言处理代码来解析经纪商的定价 - 我希望我能向你展示,但已经过去太久了,这些内容已经找不到了。

  2. 在社区中公开发表学习过程内容可以达到人类最快的学习速率 - L((PN)^2)![31]

  3. 这股AI浪潮是如此之大。不要相信我的话,听听比尔·盖茨的话[32],他说这是自图形用户界面以来最重要的技术进步。

  4. 寒冬将至。在某一天,这个AI盛夏将结束,AI寒冬[33]将再次到来。了解这股AI浪潮的重要性在于它可能会在任何寒冬中存活下来,就像2001年经济衰退后互联网行业只是短暂地停顿了一下。

  5. 强制使用生成式AI(Generative AI) 这个术语会让我们感到不愉快,因为我们都认为它被过度炒作了[34]…但是目前还没有找到更好的替代词。

  6. 再次强调,在公开的社区发表学习内容很重要,因为担心影响我的个人名誉,我会尽可能正确,并让我在犯错时感受到额外的压力。

END

参考资料

[1]https://learninpublic.org/

[2]https://www.swyx.io/learn-in-public

[3]https://thedecisionlab.com/biases/the-sunk-cost-fallacy

[4]https://en.wikipedia.org/wiki/General-purpose_technology

[5]https://twitter.com/swyx/status/1640561992472866816

[6]https://www.coursera.org/specializations/machine-learning-introduction

[7]https://www.fast.ai/posts/2016-10-08-course-background.html

[8]https://www.fast.ai/posts/part2-2022.html

[9]https://twitter.com/Suhail/status/1591813110230568963?ref=hackernoon.com

[10]https://twitter.com/karpathy/status/1468370605229547522

[11]https://twitter.com/search?q=%22just%20matrix%20multiplication%22&src=typed_query&f=top

[12]https://www.latent.space/p/ok-foomer

[13]https://www.linkedin.com/in/goodside/

[14]https://twitter.com/swyx/status/1616541173996482560?lang=en

[15]https://twitter.com/goodside/status/1617735459026915329

[16]https://news.ycombinator.com/item?id=35111646

[17]https://changelog.com/podcast/532#transcript-8

[18]https://twitter.com/ggerganov/status/1635636358126370817

[19]https://a16z.com/2022/11/16/creativity-as-an-app/#section–1

[20]https://langchain.com/

[21]https://en.wikipedia.org/wiki/Emad_Mostaque

[22]https://twimlai.com/podcast/twimlai/stable-diffusion-generative-ai/

[23]https://research.runwayml.com/the-research-origins-of-stable-difussion

[24]https://github.com/CompVis

[25]https://stratechery.com/2022/an-interview-with-daniel-gross-and-nat-friedman-about-the-democratization-of-ai/

[26]https://techcrunch.com/2022/10/18/ai-content-platform-jasper-raises-125m-at-a-1-7b-valuation/

[27]https://www.goodtherapy.org/blog/change-is-a-choice-nurturing-neuroplasticity-in-your-life-0930154

[28]https://twitter.com/i/lists/1585430245762441216

[29]https://github.com/sw-yx/ai-notes/

[30]https://discord.gg/xJJMRaWCRt

[31]https://www.swyx.io/big-l-notation

[32]https://www.gatesnotes.com/The-Age-of-AI-Has-Begun

[33]https://en.wikipedia.org/wiki/AI_winter

[34]https://www.latent.space/p/why-prompt-engineering-and-generative

本文经原作者授权,由Baihai IDP编译。如需转载译文,请联系获取授权。

原文链接

https://www.latent.space/p/not-old

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/501027.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

蓝牙耳机哪个牌子好?无线蓝牙耳机前十排名

现如今,蓝牙耳机品牌越来越多,很多人都不知道怎么选。下面,我来给大家推荐十款很不错的蓝牙耳机,有需要的朋友可以参考一下。 一、南卡小音舱Lite2蓝牙耳机 参考价:239 蓝牙版本:5.3 南卡作为国产影音数码…

[数据库系统] 四、分组操作符与聚集函数

第1关:数据统计(初级) 使用 group by 语句结合聚集函数解决数据统计问题 数据统计 一般的数据统计关系代数表达式如下: 其中L是属性集。含义是在属性集L上分组,分组后用函数fun运算 ,如 表示按性别sex的…

Android UI深度理解:Activity UI视图结构

Activity UI视图结构 每个Activity都会获得一个窗口,那就是Window,它用于绘制用户的UI界面 Window是一个抽象类,提供了绘制窗口的一组通用API,PhoneWindow是它的唯一实现类 DecorView是所有应用窗口的根节点。是FrameLayout的子类…

java 生产者消费者问题解决办法

Java的生产者消费者模式是 Java的核心之一,它可以提供很好的性能和扩展性。但是在 Java的生产环境中,生产者消费者模式并不是很稳定,因为如果出现网络问题、程序崩溃等情况,生产者消费者模式可能会不稳定,给业务带来影…

实例七:MATLAB APP design- 灰色预测-G(1,1)

注:该算法主要用来做预测,不需更改调试程序,可以直接导入数据使用。在下面会详细介绍APP制作的过程以及使用方法。 一、灰色预测-G(1,1)的原理解析 1. 生成累加数据 k表示时刻, 表示 t=k 时刻某量的观测值,不妨设 , 将原始数据列记成

工控机AllInOne——篇5,pve安装istoreos

工控机AllInOne——篇5,pve安装istoreos 1、准备 istoreos img镜像 2、镜像解压 3、镜像上传到pve iso 4、虚拟盘挂载 qm importdisk 10X XXX local-lvm其中10X代表是pve虚拟机序号,XXX代表iso文件上传位置 之后将虚拟盘设为sata 5、启动pve虚拟机…

腾讯云轻量8核16G18M服务器带宽CPU系统盘性能测评

腾讯云轻量应用服务器8核16G18M带宽配置,18M公网带宽下载速度峰值可达2304KB/秒,折合2.25M/s,系统盘为270GB SSD盘,3500GB月流量,折合每天116GB流量。腾讯云百科分享腾讯云轻量服务器8核16G18M配置、CPU型号、公网带宽…

全年前装出货超200万台,W/AR HUD赛道进入新竞争周期

作为座舱智能化、体验升级的关键环节,HUD赛道仍处于快速变化周期。 本周,水晶光电宣布,已经正式获得捷豹路虎全球下一代EMA电气化平台多个车型的WHUD和AR HUD定点,后者作为捷豹路虎的全新纯电动平台,预计将于2025年量…

数据可视化第二版-拓展-和鲸网约车分析一等奖作品

文章目录 数据可视化第二版-拓展-网约车分析案例竞赛介绍 1等奖作品-IT从业者张某某的作品结论过程数据和思考数据处理数据探索数据分析方法选择数据分析相关性分析转化率分析分析结论 完单数量分析分析结论 司机数量分析分析结论 时间分析每日订单分析 工作日各时段分析周六日…

redis(5)

需求:防止用户进行暴力破解密码 package com.example.demo;import org.springframework.beans.factory.annotation.Autowired; import org.springframework.beans.factory.annotation.Qualifier; import org.springframework.data.redis.core.HashOperations; import org.sprin…

数据结构-树、森林应用(哈夫曼树)

目录 一、树存储结构 1.1双亲表示法 1.2孩子表示法 *1.3孩子兄弟表示法 * 二、树,森林、二叉树之间的转化 三、树和森林的遍历 3.1树 *3.1.1先根遍历 *3.1.2后根遍历 *3.1.3层次遍历 3.2森林 * 3.2.1先序遍历 *3.2.2中序遍历 *等同关系 四、哈夫曼树和哈夫…

开源音频处理库AudioLDM

环境 windows 10 64bitAudioLDM 0.1.1anaconda with python 3.8nvidia gtx 1070Ti 简介 AudioLDM 是一个开源的音频处理库,它可以用于实现语音识别、语音合成、语音转换等应用,很多 AIGC 大模型都在用它。该库提供了一组音频信号处理算法,包括…

shell脚本知识汇聚之地

shell脚本 shell脚本shell脚本编写变量的定义变量的使用变量值调换引号的使用环境变量输出全局变量只读变量位置变量预定义变量条件判断操作if语句case语句for语句while语句until语句退出循环sleep循环等待时间shift 去除第一个位置变量参数${} $变量的特殊显示方式echo用法 sh…

el-cascader后台给一组id回显可选择的选项列表

根据后台给一组id回显可选择的选项列表 <template><div><el-cascader:key"keyValue"ref"cascader"v-model"pids":props"{ label: name, value: id }":options"options"clearablefilterablechange"handl…

Maven配置阿里云仓库https

2022年开始&#xff0c;阿里云对以前的maven仓库地址进行升级&#xff0c;由原来的http换成https 原来链接&#xff1a; http://maven.aliyun.com/repository/public 现在链接&#xff1a; https://maven.aliyun.com/repository/public maven settings.xml配置 maven settin…

QString的解析与常用功能

QString存储一个16位QChar字符串&#xff0c;其中每个QChar对应一个UTF-16代码单元。(编码值大于65535的Unicode字符使用代理对存储&#xff0c;即两个连续的qchar。) Unicode是一个国际标准&#xff0c;支持目前使用的大多数书写系统。它是US-ASCII (ANSI X3.4-1986)和Latin-1…

盐湖卤水中分离硼的工艺有哪些

锂因其优良的物理化学性质&#xff0c;被认为是“推动世界进步的能源金属”&#xff0c;随着新能源、冶金等行业的快速发展&#xff0c;人们对锂的需求量逐年攀升。然而地壳中锂的含量仅为0.0065%左右&#xff0c;约80%的锂资源蕴含于盐湖卤水中。 盐湖卤水成分复杂&#xff0c…

Redis入门到入土(day03)

Redis的持久化 Redis 是内存数据库&#xff0c;如果不将内存中的数据库状态保存到磁盘&#xff0c;那么一旦服务器进程退出&#xff0c;服务器中的数据库状态也会消失。所以 Redis 提供了持久化功能&#xff01; RDB&#xff08;Redis DataBase&#xff09; 什么是RDB 在指…

HugNLP发布,集成多种NLP任务,可训ChatGPT类模型

HugNLP发布&#xff0c;集成多种NLP任务&#xff0c;可训ChatGPT类模型 作者&#xff1a;王嘉宁 HugNLP——全面统一的NLP框架开源了&#xff01; 近日&#xff0c;华师大HugAILab团队研发了HugNLP框架&#xff0c;这是一个面向研究者和开发者的全面统一的NLP训练框架&#x…

java版企业电子招投标采购系统源代码之系统的首页设计

​​ 功能模块&#xff1a; 待办消息&#xff0c;招标公告&#xff0c;中标公告&#xff0c;信息发布 描述&#xff1a; 全过程数字化采购管理&#xff0c;打造从供应商管理到采购招投标、采购合同、采购执行的全过程数字化管理。通供应商门户具备内外协同的能力&#xff0c;为…