对想学习人工智能或者大模型技术从业者的建议

news2024/11/15 11:08:53

“ 技术的价值在于应用,理论与实践相结合才能事半功倍”

写这个关于AI技术的公众号也有差不多五个月的时间了,最近一段时间基本上都在保持日更状态,而且写的大部分都是关于大模型技术理论和技术方面的东西。‍‍‍‍‍‍‍‍‍

然后最近一段时间就发现了一个问题,写的越理论的东西看的人越多,越实际越细节的东西看的人越少,不知道是因为系统推送的原因,还是观看者的原因。‍‍‍‍‍

因此,根据这个现象就想提几个学习的建议,让大家少走一点弯路。‍‍‍‍‍‍‍‍‍‍‍‍‍

01

人工智能技术学习建议‍‍‍

这个关于学习人工智能技术的建议,也可以说是一个学习技术的方法论。

首先大家要明白一点——(任何)技术都是一个更偏向于实践的东西,具体来说就是学习技术实践要大于理论,要以实践为主理论为辅,而不是反其道而行之,但是在实际的经历和观察中,我发现很多人却是以理论为主,实践为辅。‍‍

_知行合一,在知中行,在行中知_‍‍‍‍‍‍‍‍‍

就拿这个公众号来说,越理论的东西看的人越多,真的涉及到实操的部分看的人反而变少了。

比如说,很多人对什么是人工智能,什么是神经网络,什么是大模型,什么是多模态大模型等等很感兴趣;但对大模型实际过程中的训练数据的收集与清洗,损失差和反向传播等核心操作却视若无睹。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

但是这些理论的东西,每个理解过人工智能技术的人都能说上几句;但真的让他来实际操作从大模型的选型,模型的训练和部署来打造一个能用的大模型,这时他就开始傻眼了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

理论需不需要懂?‍‍‍‍

需要,但并不是特别需要;很多理论只是看别人的书和文章你是不会真正明白的,只有实际动手操作时才能真正理解理论。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

就类似于java面试八股文,随便一个面试者都可以说上几句;但一旦涉及到具体的业务场景或技术场景,这时很多人就傻眼了,而这也是不同面试者之间的差距。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

理论并不等于技术,技术也不等于理论,技术更多时候是理论和实践的结合;在实践中检验理论,在理论中指导实践,最后理论和实践互相验证,互相修正。‍‍‍‍

所以说,学习大模型技术最重要的是上手实践一下,不一定非要像openAI,谷歌,meta一样搞那么大的模型,哪怕只是设计一个两三层的神经网络模型,然后自己完成模型的设计,训练和部署也比一直看理论更有用。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

或者是找一些开源的大模型项目,看看它们解决了哪些问题;是怎么做的,又为什么这么做,是否有其它解决方案;而且一些小模型个人电脑就可以跑的起来,或者找一些免费的GPU资源,比如谷歌的Colab平台。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

这样你才能知道不同模型之间的差别是什么,怎么使用模型解决不同领域的问题等。‍‍‍‍‍‍‍‍‍

_学习大模型的三个方向_‍‍

很多人学习人工智能技术就一心扑在技术上,认为自己把技术学好了就一定能找到工作,一定能成为公司技术部核心成员;但大家要明白的一个事实是,技术是为业务服务的,技术的作用是解决业务问题,而不是搞学术研究。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

学习大模型技术,个人认为有三个方向:‍

大模型基础技术大牛‍‍‍‍‍

说白了就是数学大牛,大模型技术本质就是一个数学模型,因此需要做这个方向的技术人员更多的是数学专业的大牛;比如说微分,概率,线性代数等。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

他们的作用是设计更好的机器学习算法和打造更好的技术学习模型,比如怎么设计一个更好的神经网络,怎么设计更好的损失函数,怎么优化反向传播算法等。‍‍‍‍‍‍‍‍

这种工作更加偏向于底层技术和学术研究,而且这种人才待遇好,要求高,基本上不是名牌大学毕业的很难参与进来。‍‍‍‍‍‍‍‍‍

大模型“运维”人员‍‍‍‍

之所以说是“运维”人员,是这个方向需要做的就是根据企业的业务需求,找到合适的商业或开源模型,然后能够收集和处理训练数据,然后完成模型的训练,部署和升级等任务;能够熟练使用不同的模型和工具处理不同领域的问题。因为他们特别像传统的服务器维护人员,因此叫大模型“运维”。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

这个技术方向就需要懂得大模型的基础理论,并且有很强的实操能力,然后有充足的业务经验,能够把大模型和业务场景相结合,因此这个更看重的是经验和实操,反而技术要求并不高,重要的是能够熟练使用各种工具。‍‍‍‍‍‍‍‍‍‍‍‍‍

大模型上层应用构建‍‍

再一个方向就是基于大模型构建上层应用,这个方向更像是一个传统的技术开发者,不需要了解大模型的运作原理,只需要能使用大模型的功能文档和接口文档即可,如果能懂一些大模型的理论就更好不过了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

个人建议

对大部分人来说,选择后两种方式比较好,最好是能把后两种方向结合起来。因为研究大模型基础技术的成本太高,绝大部分企业都没有足够的资金和技术来实现,因此其就业的压力和竞争力可想而知。‍‍‍‍‍‍‍‍‍

其次,后两个方向只需要有一定的经验和学习能力就可以做到,甚至很多程序员可以直接转行成为第三种大模型应用开发者。‍‍‍‍‍‍‍‍

所以,对大部分人来说,最好的选择就是搞大模型应用,门槛相对较低,前景广阔。‍‍‍

因此,对个人来说一定要弄清楚自己的定位,否则就会导致自己没有努力的方向;然后这个也想学,那个也想学,最后什么都会又什么都不会。‍‍‍‍‍‍‍‍‍‍‍

人工智能机器人小程序,感兴趣的可以点击查看:

_学习写作_‍‍‍‍

对技术人员来说,写作应该是一项必不可少的技能之一。写作的作用并不是说要你的文笔有多好,而是要把自己学习和思考的过程给记录下来,哪怕是错的。‍

一是方便后续回顾,二是写作的过程是一个从新思考的过程,有些不明白不清晰的地方在写作的过程中就会重新进行思考,这时就会有一个更加清晰的认识。‍‍‍‍‍‍‍‍‍

有句老话叫:“厉害的不是你学会了什么,而是你能够用简单的语言把你学的东西讲明白”。‍‍‍‍‍‍‍‍‍‍‍‍

学习是一个输入端过程,而写作是一个输出的过程。‍‍‍

就那小编个人来说,写公众号最重要的目的就是记录自己的学习过程;你说小编写的文章内容都是对的?那也不见得,可能很多地方理解有误,但这个并不重要。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

有些东西当时没理解或者理解错了,后面可能有一天顿悟就明白过来了;而这也是为什么有些文章写的是同一个话题,但内容却不太一样的原因。‍‍‍

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

👉1.大模型入门学习思维导图👈

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。

对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。

在这里插入图片描述
在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

在这里插入图片描述

👉4.大模型落地应用案例PPT👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(全套教程文末领取哈)

在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2078279.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网络安全售前入门04——审计类产品了解

目录 1.前言 2.数据库审计介绍 2.1产品架构功能 2.2应用场景 2.3部署形式 2.4产品价值 2.5选型依据 1.前言 为方便初接触网络安全售前工作的小伙伴了解网安行业情况,我制作一系统售前入门(安全产品,安全服务,法律法规等)文章介绍,希望能给初进网安职场的小伙伴提供…

STL中的stack与queue

前言: stack与queue是STL中的容器适配器,而不是容器。何为适配器?给手机充电的充电器就是一种适配器,将高电压变成低电压。适配器是用来做转化的,不用来直接管理数据,而是在其他容器的基础上去封装转换。 …

WordNet介绍——一个英语词汇数据库

传统语义知识库最常见的更新方法是依赖人工手动更新,使用这种更新方法的语义知识库包括最早的 WordNet、FrameNet和 ILD,以及包含丰富内容的 ConceptNet和 DBPedia。此类语义知识库的特点是以单词作为语义知识库的基本构成元素,以及使用预先设…

C++ | Leetcode C++题解之第376题摆动序列

题目&#xff1a; 题解&#xff1a; class Solution { public:int wiggleMaxLength(vector<int>& nums) {int n nums.size();if (n < 2) {return n;}int prevdiff nums[1] - nums[0];int ret prevdiff ! 0 ? 2 : 1;for (int i 2; i < n; i) {int diff n…

记一次NULL与空字符串导致的分组后产生重复数据

目录 一&#xff0c;场景说明二&#xff0c;实现功能三&#xff0c;修改原实现方法四&#xff0c;说明 一&#xff0c;场景说明 想实现这样一个功能&#xff0c;统计人员信息中不同性别的人的总工资。 实现方式&#xff1a;将数据group by 分组后累加。 二&#xff0c;实现功…

叉车(工业车辆)安全管理系统,云端监管人车信息运营情况方案

近年来&#xff0c;国家和各地政府相继出台了多项政策法规&#xff0c;从政策层面推行叉车智慧监管&#xff0c;加大叉车安全监管力度。同时鼓励各地结合实际&#xff0c;积极探索智慧叉车建设&#xff0c;实现作业人员资格认证、车辆状态认证、安全操作提醒、行驶轨迹监控等&a…

探秘Facebook的人工智能战略:如何用智能技术重塑社交网络

人工智能&#xff08;AI&#xff09;正以前所未有的速度渗透到各个领域&#xff0c;社交网络也不例外。作为全球最大的社交平台之一&#xff0c;Facebook&#xff08;现Meta&#xff09;正利用人工智能技术重塑其网络环境&#xff0c;提升用户体验。本文将深入探讨Facebook的人…

对SpringBoot项目Jar包进行加密防止反编译

最近项目要求部署到其他公司的服务器上,但是又不想将源码泄露出去,要求对正式环境的启动包进行安全性处理,防止客户直接通过反编译工具将代码反编译出来,本文介绍了如何对SpringBoot项目Jar包进行加密防止反编译,需要的朋友可以参考下 场景: 最近项目要求部署到其他公司的服…

华为HCIP-datacom 真题 (2024年下半年最新题库)

备考HCIP-datacom的小伙伴注意啦 2024年下半年8月份最新题库带解析,有需要的小伙伴移动至文章末 1.BGP 邻居建立过程的状态存在以下几种&#xff1a;那么建立一个成功的连接所经历的状态机顺序是 A、3-1-2-5-4 B、1-3-5-2-4 C、3-5-1-2-4 D、3-1-5-2-4 答案&#xff1a;D 解析…

界面控件DevExpress VCL v24.2路线图预览——增强云集成、简化应用程序皮肤等

DevExpress VCL Controls是Devexpress公司旗下老牌的用户界面套包&#xff0c;所包含的控件有&#xff1a;数据录入、图表、数据分析、导航、布局等。该控件能帮助您创建优异的用户体验&#xff0c;提供高影响力的业务解决方案&#xff0c;并利用您现有的VCL技能为未来构建下一…

el-pagination 下拉条目数最后一个样式改成全部

2024.08.27今天我学习了如何把el-pagination的下拉条目数修改&#xff0c;效果如下&#xff1a; 我们需要把最后一条选择换成全部展示&#xff0c;其实传给后端的还是总的数量&#xff0c;只是换了一个content&#xff0c; 通过f12查看元素可以拿到.el-select-dropdown__item …

华为鸿蒙NEXT大揭秘:微信版功能曝光,简洁界面回归

在科技界&#xff0c;每一次操作系统的更新迭代都是一场期待与猜测的盛宴。华为的鸿蒙系统自问世以来&#xff0c;就以其独特的设计理念和强大的功能吸引了全球的目光。而今&#xff0c;随着微信版鸿蒙NEXT的曝光&#xff0c;我们似乎又将迎来一次科技的飞跃。但这一次&#xf…

【多系统萎缩患者必看!】营养补给站,守护健康每一刻✨

Hey小伙伴们~ 今天我们来聊聊一个需要特别关爱的话题——多系统萎缩&#xff08;MSA&#xff09;患者的营养补充秘籍&#xff01;&#x1f31f; MSA是一种复杂的神经系统疾病&#xff0c;它影响我们的多个身体系统&#xff0c;让每一天的生活都充满了挑战。但别担心&#xff0c…

【工具】轻松解锁SQLite数据库,一窥微信聊天记录小秘密

前言 &#x1f34a;缘由 SQLite里藏秘密&#xff0c;微信聊天有痕迹 &#x1f423;闪亮主角 大家好&#xff0c;我是JavaDog程序狗 今天跟大家分享一个开源小工具PyWxDump&#xff0c;是一个用于获取 wx 账户信息&#xff08;昵称/账户/电话/电子邮件/数据库密钥&#xff0…

利用autoDecoder工具在数据包加密+签名验证站点流畅测试

站点是个靶场 https://github.com/0ctDay/encrypt-decrypt-vuls 演示地址http://39.98.108.20:8085/ 不是仅登录位置暴力破解的那种场景&#xff0c;使用autoDecoder&#xff08;https://github.com/f0ng/autoDecoder&#xff09;的好处就是每个请求自动加解密&#xff0c;测…

35岁失业后,这3个AI副业,也能养活自己

不少粉丝曾问我&#xff0c;有没有用AI赚钱的方法。 *眼看就快到35岁中年危机&#xff0c;想提前安排个退路。* 对于大家的焦虑&#xff0c;我很能理解&#xff0c;花钱容易挣钱难&#xff0c;尤其是在当下&#xff0c;大环境不是那么好&#xff0c;很多人进入佛系状态&#…

【STM32】位带操作

一、位带操作 1.意义 回想以前写51代码 ​ P0 0x10; //将P0端口设置为0x10 P1_01; //将P1端口0号引脚设置为高电平 a P2_2; //获取P2端口2号引脚的电平 根据上述的方法&#xff0c;我们可以发现快速定位修改某个引脚的电平还有获取引脚的状态 2.原因 GPIO_SetBits、GPI…

2025深圳国际微波射频及天线技术应用展览会

2025深圳国际微波射频及天线技术应用展览会 2025 Shenzhen International Microwave RF and Antenna Technology Application Exhibition 时间&#xff1a;2025年04月9-11日 地点&#xff1a;深圳会展中心(福田&#xff09; 详询主办方陆先生 I38&#xff08;前三位&#…

CRMEB 多店版供应商订单管理

订单列表 一、功能介绍 查看所有供应商订单数据&#xff0c;详情&#xff0c;可以提醒发货 根据供应商筛选&#xff0c;可以查看不同类订单 二、操作流程 供应商 &#xff1e; 订单管理 > 订单列表 三、功能说明 售后列表 一、功能介绍 查看所有供应商售后订单数据&a…

一个案例讲透如何做好竞品分析!

随着国内互联网市场进入下半场&#xff0c;各个领域的相关产品层出不穷&#xff0c;即使是新鲜事物&#xff0c;一旦出现&#xff0c;也会迅速造成行业内部拥挤。行业发展如此之快&#xff0c;闭门造车绝对不是产品迭代更新应有的设计方式。敞开大门&#xff0c;出去看看别人家…