2024届应届生突破1179万人,如何瞄准AI行业,获得高薪职业前景

news2024/12/23 9:01:49

图片

应届生如何开启AI行业的职业生涯?

©作者|Zhongmei

来源|神州问学

引言

人工智能和数据科学几乎可以在任何产生数据的场合中发挥作用,因为它们开辟了一种全新的范式——让机器能够从数据中提炼出知识。自2011年人工智能走出实验室的门槛,到2016年阿尔法狗在围棋对决中战胜李世石和柯洁,"人工智能"(AI)开始受到广泛的关注。直到2022年尾,以ChatGPT为代表的大规模语言模型再次引发了一轮AI浪潮。人工智能的迅速崛起催生了大量的工作机会,吸引了众多人才蜂拥而至,希望进入这个令人兴奋的领域。如果你也是渴望加入这一行列的应届生,希望本文能为你提供实用的指南和启示。

图片

入门:学习基础知识

事实上,标有AI标签的研究论文数量已经远远超出任何人一生所能阅读的范围。因此,选择学习的主题并确定优先顺序变得至关重要。在机器学习技术的职业生涯中,公认的重要主题包括:

1.  数学基础:关键内容包括微积分(偏微分、链式法则、矩阵求导等),线性代数(向量、张量、矩阵运算、求逆、特征值分解、行列式等),统计与概率(包括离散与连续概率、标准概率分布、独立性与贝叶斯规则、假设检验、最大似然估计(MLE)和最大后验估计(MAP)等)以及优化理论(线性与非线性优化、凸优化/非凸优化及其求解方法如梯度下降、牛顿法等)。此外,探索性数据分析(EDA)也是必备技能,通过可视化和其他方法系统地探索数据集,在分析错误和获得洞见上至关重要。

2.  机器学习技能:理解监督学习和非监督学习至关重要。能够解释传统模型,如线性回归、逻辑回归、神经网络、决策树、聚类和异常检测等也同样重要。除了具体模型之外,理解机器学习的核心概念以及这些东西如何发挥作用也是必不可少的:比如偏差/方差(bias/variance)、成本函数(cost functions)、正则化(regularization)、优化算法(optimization algortithms)和误差分析(error analysis)等等。

3.  深度学习:这一模拟人脑神经元工作模式的技术已成为机器学习的重要组成部分。深入理解神经网络的基础和掌握实践技巧极为关键,如反向传播、梯度下降、序列模型、多层感知机(MLP)、卷积神经网络(CNN)、循环神经网络(RNN)以及变革性的Transformers。同时,掌握高效参数微调(peft)和基于人类反馈的对齐微调策略(RLHF)也至关重要。

4.  软件开发:在机器学习建模技能的基础上,具备一定的软件开发能力会成为加分项。熟悉Python编程、关键库如TensorFlow、PyTorch和scikit-learn;在大模型出现以后,了解如langchain和llamaindex等开发框架也极为重要;同时,掌握与机器学习相关的数据结构、算法(连带与数据库和数据操作相关的算法)和软件设计也不容忽视。

不难发现,要学的东西很多,而且这些领域并不是独立存在的,或多或少都互联关联和互通,所以不要试图把所有相关的数学通学一遍再开始你的学习,而是应该再学习的过程中延展知识结构,毕竟可以在对机器学习的学习中,有针对性的补充基础数学知识。同时,要做好终生学习的心里准备,学习这些成熟技术完全只是基础中的基础,AI这个领域变化之快,跟上不断变化的技术更为重要,想跟上时代,除了学习别无选择。最后,给和我一样减肥喜欢点收藏等于练了的人一点建议:AI学习的开始,不需要收集过多的资料,可以从一个标准课程开始,比如Coursera上面有吴恩达的机器学习课程,就是一个非常好的基础入门。如果你对大语言模型格外感兴趣,也可以看台湾大学李宏毅生成式人工智能教程(https://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php),如果你英语很好也对机器学习有基础入门,就可以看OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 整理的一份机器学习论文清单Ilya 30u30(https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE)。The small changes that change everthing. 不用今天就学足30分钟,可以从看3分钟的小段开始。其次,因为AI的迭代性快,所以要注意资料的时效性。超过三年的信息很可能就不再适用了。

图片

入行:积累项目经验

职业生涯的成功往往包括参与众多项目,这些项目应在范围、复杂性和影响力上随着时间的推移逐步增长。因此,最好是从小项目开始。早期项目可以作为学习的平台,随着你技能的提升,逐渐过渡到更大的项目。换句话说,作为初学者,你不能期待别人会轻易地分享好主意或资源,但通过小项目的成功,你可以更容易地获得他人的支持和资源,以承担更大的项目。例如,学生可以参加优质的免费课程并参与Kaggle等实际操作竞赛。如果你已经在职,可以尝试发展一份与你兴趣相关的副业,这不一定要发展成更大的事业,但足以激发你的创造力。吴恩达教授曾分享,当自己还是全职教授的时候,虽然在线教育最初不是他的职责范围,但他早期在家录制教学视频的经历最终成为他深入在线教育领域的垫脚石。硅谷也充满了许多最初作为副业启动的项目,最终发展成成功企业的例子。

图片

为什么项目很重要?

首先,一个项目涵盖众多规划和步骤。一个项目通常从一个商业问题出发(而不是人工智能问题),比如,你想将AI应用在气候环境这个问题上,就会发现电网运营商其实是无法准确预测出风能、太阳能等间歇性能源未来某刻能产生的电量的。深刻了解这个商业问题后,你可以进行头脑风暴,寻找解决方案。比如,你想到使用卫星图像更准确的映射风力涡轮机的高度和位置,以此估计它的发电能力。以及,天气数据可以预测太阳辐射量,用来估计太阳能发电量。随后,你需要评估这些解决方案的可行性和潜在价值,可能包括查阅相关论文、咨询领域专家或进行小型实验以快速验证概念(poc)。一旦认为项目具有足够的价值,下一步就需要设定具体的目标和里程碑。目标其实就是达成的指标,这些目标既包括机器学习指标(比如precision、F1 Score等等),也包括商业指标(如收入等)。里程碑则包括为了完成这个目标需要完成的重要步骤,以及它们的deadline。然后,需要考虑预算,思考完成项目需要的数据、运算资源、时间、外部帮助等等。比如,如果真的购买卫星图像来预测风力发电量,必须确保这在预算范围内。

一个真正的项目就是在这几个步骤里不断迭代的过程,在任何步骤中,你发现当前方向不可行,都可能需要返回到之前的步骤,从一个新视角,用你的新理解继续前进。这中间面临的困难和挑战,就是一个人进步的路径。

如果没有任何项目想法怎么办?

1.  持续阅读&与人交流:多读、多思考,经常与他人交流。当得到的输入多,思考多,就很容易迸发出新的想法。同时,如果你发现别人有一个想法,你可以加入他们,一起完成一个项目,和学校里需要自己组队完成的小组作业一样。

2.  专注一个应用领域:现在很多的研究人员都在试图升级推进某基础AI技术,比如:想要发明下一代transfomers或者怎么继续扩大现有大语言模型的规模,这其实不是一个能马上上手的事情。AI尚未普及的应用领域有很多,神经网络可以用于绝大多数能想到的事上,从广告推荐到自动驾驶等等。如果你的学校或者公司在某个特定领域里,这可能帮助你发现独特的视角和未被开发的潜在机会。

什么样的项目值得去做?

1.  有助于技术成长:一方面,它需要挑战性,需要你通过研究和学习来完成,这样可以提升你的技能;但是另一方面,不可以难到无法达成,就像你不能期待一个没听过决策树的人,过来给你讲解什么是随机森林。所以通过一本好的教材或者课程中循序渐进的安排来一步一步走是个很好的选择。一个优质的项目,它的技术复杂性和/或商业影响应该可以帮助你通向更大项目。

2.  有合适的队友:好的合作者可以让你学到很多,如果可以拥有一个学习小组,就可以一起讨论问题,从周围人身上学习,互补不足。也可以一起研究,共同进步。同时,学会沟通也是关键,解释你的思路,说服你的队友,这些都是进步的途径。

图片

入职:找到合适岗位

寻找工作通常包括几个可预见的步骤:制作(捏造)出合适的简历、选择目标公司、准备面试,并最终选定职位及谈判薪资与福利。在AI行业,这个过程也不例外。首先,了解AI公司中的主要岗位和职责至关重要。作为一个技术驱动的行业,AI公司的技术团队通常包括产品经理、算法工程师、研发和测试等角色。具体来说,产品经理负责把握客户需求和开发方向;算法工程师则设计并开发用于解决特定问题的高效算法,如数据处理、图像识别、自然语言处理、机器学习等领域的算法;研发人员则负责做工程化的输出,将AI能力以产品或服务的形式提供给客户;测试人员则确保产品和服务的质量过关。找到适合自己的方向是最基本的。

在此基础上,思考是否需要在角色或行业上进行转换也很关键。例如,物理学家、软件工程师或大学生转型成为机器学习工程师属于角色转换;从医疗保健、金融服务或政府机构转入软件公司则属于行业转换。同时转换角色和行业的难度通常会更大。对于这种踏入未知的状况,你对目标工作的了解很可能不足,信息性面试就十分重要。信息性面试,虽然称为面试,但是不必在特定公司或岗位的正式面试中进行,而是最好在求职准备阶段,通过访谈某一岗位的从业者,探索他每天日常工作是什么样的,这个角色承担的责任是什么,团队是如何协作的等等。这一步骤尤为重要,因为AI领域中公司对岗位的命名并不统一,确保所申请的职位符合你的期望是关键。

在AI领域寻找工作时,还存在一些特殊的差异。许多公司处于探索阶段,正在确定自己所需的AI相关技能和如何招募具备这些技能的人才。有时,即使你觉得某个岗位名称和描述非常合适,面试官的期待却大相径庭,这时你需要清楚地表达你的潜力和相关经验。

图片

另外,一份优秀的工作机会不仅要符合预期的工作内容、工作环境和薪资,对于AI行业来说,还有两样,一个是teamate,一个是mentor。AI应用的开发通常不是单打独斗,一个生产级的AI应用不可能是一个人完成的,一个善于协作和沟通的团队,就是一份工作加分的地方。因为这不仅能提升工作效率,还有助于建立优质的社交网络或社区,从中你可以随时随地获得所需要的建议和帮助。另一方面,如果工作中你的领导很关注你的个人成长,或者有一个亦师亦友的角色,那就是件十分幸运的事情。但是如果你的工作环境不能提供足够的个人成长支持,加入一个优秀的AI社群或组织,与志同道合的人一起学习和进步,也是一个很好的选择。

尾语

AI是一个极其宽泛的概念,并不仅限于当前最火的大型语言模型(LLM)。事实上,AI行业作为一个广阔的B2B市场,包含了许多客户服务类的前端岗位,如销售、售前、运营、培训和市场营销。例如,销售人员负责识别客户需求并推广AI产品或服务;售前人员则从技术角度支持销售过程和转化;培训人员负责教育客户如何使用AI产品或服务;运营人员处理售后服务和客户关系维护;市场营销人员则致力于扩大品牌的影响力。这些角色都是AI公司或团队成功的关键组成部分。因此,如果你对AI真正感兴趣,可以从学习基础知识开始入门。这种基本的入门不仅让你熟悉AI领域的专业术语,让你看起来不再是门外汉;还能从某种程度上对AI祛魅。进一步地,当你开始学习建模和编程时,你可能会发现进入AI领域的门槛并没有想象中的那么高。事实上,LLM的出现已经大幅降低了自然语言处理领域的入门难度;反之,你也可能发现这并不是你的兴趣所在。在这一过程中,积累项目经验也提供了一个试错的机会。最后如果你完成这些步骤,可以进一步看看AI公司中人们在做什么,看看他们是否都在进行数据标注【手动狗头】。从中,你可以找到一个你认为自己能胜任、有价值、并能视为事业的工作。最终,希望你的职业选择不仅是因为某个领域的热度,而是基于对该领域的真正热情和兴趣。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1857545.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Sapphire开发日志 (十一) 登陆注册功能

任务介绍 本周实现登陆注册功能。 由于本项目主要关注在数据集的相关操作,所以对于用户的登录注册验证没有必要采取完整的一套手机号(邮箱)验证机制,简单的实现一个注册和登录功能即可。 背景效果 首先展示效果 整体背景页面和…

【事件总线】EventBus

文章目录 概述如何使用如何发布消息如何进行消息监听 来源 概述 事件总线是对发布-订阅模式(观察者)的一种实现,是一种集中式事件处理机制,允许不同的组件之间进行彼此通信而又不需要相互依赖,达到一种解耦的目的。 …

喜讯:ISO年度审核通过!

在数字化时代,质量是我们不变的追求。近日,矩阵起源迎来了一个值得庆祝的时刻——三项ISO体系年度考核顺利通过!分别为:ISO9001 质量管理体系标准认证、ISO20000信息技术服务管理体系认证及ISO27001 信息安全管理体系认证。 ISO标…

摘苹果-第13届蓝桥杯省赛Python真题精选

[导读]:超平老师的Scratch蓝桥杯真题解读系列在推出之后,受到了广大老师和家长的好评,非常感谢各位的认可和厚爱。作为回馈,超平老师计划推出《Python蓝桥杯真题解析100讲》,这是解读系列的第88讲。 摘苹果&#xff0…

品牌出海!独立站不仅是方向,而是成为跨境电商主流了

近些年,随着跨境电商3.0品牌出海和本土化时代的到来,独立站成为品牌出海的必备渠道和关键胜负手! 搭建独立站作为品牌本土化的最好展示载体,独立的品牌包装与产品页面,能够更好讲述品牌故事,因而得以快速发…

fvcore库的一些功能和使用

目录 一、安装fvcore库 二、使用 fvcore是Facebook开源的一个轻量级的核心库,它提供了各种计算机视觉框架中常见且基本的功能。其中就包括了统计模型的参数以及FLOPs等。 项目地址:fvcore 一、安装fvcore库 pip install fvcore 二、使用 1、计算模…

Debian12中搭建TiddlyWiki服务并进行配置

一、Node.js 环境安装 apt update & apt install nodejs npm ## 查看版本 node -v npm -v二、安装Tiddlywiki npm install -g tiddlywiki## 查看版本号 tiddlywiki --version 三、配置并运行 tiddlywiki ## 在/home 目录自动创建Testwiki文件夹,作为wiki的存…

项目实践---Windows11中安装Zookeeper/Hadoop/Hive的部分问题解决

一.Hadoop与Hive兼容版本选择 正常来说,Hadoop与Hive版本不兼容会出现很多问题导致hive安装失败,可以先确定HIve的版本,比如:要用Hive3.1.2版本,该如何确定使用Hadoop的版本呢,需要我们在hive源码中找到对…

自学鸿蒙HarmonyOS的ArkTS语言<四>@Builder自定义构建函数

作用:可以提取重复的ui, 在buil()中调用 【官方文档传送门】 一、用在自定义组件内 自定义组件内可以有一个或多个Builder只能在所属组件的builder方法和其他Builder中调用,组件外不能调Builder中的this指当前所属组件,组件的状态变量可以在…

LeetCode 热题100 --双指针

双指针 b站UP主蜜糖:由于数据特征的有序性(大小或者正负),所以可以证明当前节点一定是优于过往节点,从而可以通过数据的维度数量的指针,逐步的迭代收敛最终找到最优解。 283.移动零 相关标签 :…

计算机网络 —— 应用层(电子邮件)

计算机网络 —— 应用层(电子邮件) 电子邮件发送电子邮件的过程SMTP特性工作流程 电子邮件格式MIME关键组件工作方式 POP/IMAPPOP(邮局协议)IMAP(因特网邮件访问协议) 基于万维网的电子邮箱特点优势常见的基…

营销复盘秘籍,6步法让你的活动效果翻倍

在营销的世界中,每一次活动都是一次探险,而复盘就是探险后的宝藏图,指引我们发现问题、提炼经验、优化策略。 想要学习如何复盘,只要了解以下复盘六大步骤,即可不断总结,逐渐走向卓越。 第一步&#xff1…

lvgl v8.3 windows仿真

1,下载安装codeblocks20.03 https://zenlayer.dl.sourceforge.net/project/codeblocks/Binaries/20.03/Windows/codeblocks-20.03mingw-setup.exe?viasf1 2,下载代码 git clone --recurse-submodules https://github.com/lvgl/lv_port_win_codeblock…

fairseq (Facebook AI Research) 包

0. Abstract 最近在看一个用 RNNs 网络做 Translation 任务的程序, 关于数据处理部分, 主要用到工具包 sentencepiece 和 fairseq, 前者主要是对文本进行分词处理, 后者则是对已分词的文本进行二进制化和快速加载. 包越方便使用, 就说明包装得越狠, 也就越令人一头雾水, 本文简…

虚拟机拖拽文档造成缓存过大

查看文件夹大小:du -h --max-depth1 缓存位置:~/.cache/vmware/drag_and_drop 删除:rm -fr ~/.cache/vmware/drag_and_drop 释放了3GB

Javascript中的this关键字指向

this关键字介绍 不同情况下的this 1.对象调用方法中的this 2.在全局使用this(单独使用) 3.函数中的this 4.函数严格模式下 5.事件中的this 6.构造函数中的this 7.箭头函数没有this call()、apply()、bind() 的用法 this关键字介绍 面向对象语言中 this 表示当前对象…

JavaScript中的内置对象

// 用法2:参数:指定的时间的字符串 创建一个指定的时间 // new Date(‘2018-12-12 12:00:00’) var date1 new Date(‘2018-12-12 12:00:00’); console.log(date1); // 用法3: 参数可以是年月日时分秒 月份从0开始 // var date2 new …

基于Java实验室课程管理系统设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟 感兴趣的可以先收藏起来,…

Linux 阻塞和非阻塞 IO 实验学习

Linux 阻塞和非阻塞 IO 实验学习 IO 指的是 Input/Output,也就是输入/输出,是应用程序对驱动设备的输入/输出操作。当应用程序对设备驱动进行操作的时候,如果不能获取到设备资源,那么阻塞式 IO 就会将应用程序对应的线程挂起&…

【初阶数据结构】二叉树(附题)

目录 1.树概念及结构 1.1树的概念 1.2 树的相关概念(树结构的相关概念命名参考自然树和人的血缘关系) 1.3 树的表示 1.4 树在实际中的运用(表示文件系统的目录树结构,初次之外网盘中使用到) 2.二叉树概念及结构 …