**工业大模型伴随着大模型技术的发展,逐渐渗透至工业,处于萌芽阶段。**就大模型的本质而言,是由一系列参数化的数学函数组成的计算系统,且是一个概率模型,其工作机制是基于概率和统计推动进行的,而非真正的理解和逻辑推理,因此,当前大模型具有不可解释性和幻觉不可消除等主要特征。就大模型落地工业的情况而言,工业互联网、等工作已经让部分工业企业遍历了数据采集-数据存储-数据处理-数据分析-数据资产沉淀-数据应用的过程,部分场景已经准备好了向基础大模型投喂的“数据原料”,当经过简单数据处理、微调、适配后,可以解决部分垂直细分场景问题,具有落地可行性。就工业大模型的发展进度而言,工业大模型与工业互联网一样,都是要挖掘数据资产的价值,而数据准备的阶段性工作在工业互联网时期大部分已经准备好,故我们预计工业大模型的进程在技术不受限的前提下,可能会快于工业互联网。当然,工业大模型是以大模型技术为驱动,其进程快慢很大程度受限于大模型本身能力的进化。
**工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。**就参与玩家而言,大模型技术底蕴、行业know how、运维资源等方面是各类玩家主要锚定的优势,且都是基于自身优势点,围绕具体应用场景摸索大模型在工业的落地性进行市场切入的。就具体产品形态而言,整体还较为稚嫩,目前大模型的能力更多还是依附于已有产品体系,鲜少有独立的产品出现,未来随着大模型流量入口特性明朗,有望独立成产品。就应用场景而言,当前大模型的不可解释性和幻觉等特性,与工业“0容错”的特性相悖,因此当前大模型落地工业的探索更多聚焦于偏运营的、具有一定容错能力的场景(如知识问答、辅助设计/代码生成等),而生产制造等核心场景的探索需要静待模型进化以及CV大模型、多模态大模型的发展。就发展挑战而言,模型、数据、应用、商业变现是无法避开的话题,且各方相互影响,互利共赢。
**大模型落地工业的探索中,还处于非常早期的阶段,供需双方都在尝试,当然,也有很多问题值得探讨与思考。**1)大模型落地工业的竞争要素:基础能力、模型能力、模型应用是主要竞争点,且在不同行业发展阶段,其相对竞争优势有所不同,具体而言:短期主要看大模型技术,长期则主要看模型应用深度。2)大小模型间的关系:大小模型间不存在替代关系,是并存且是协同融合赋能的关系。3)工业大模型服务走向平台化:大模型落地工业的服务平台化特征以开始显现,且逐步形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案。4)产业数据拉通助力工业大模型能力进化的同时,对大模型落地工业的广度、深度都大有裨益。
当我们在说AI时,在说什么?
AI本质就是一系列参数化的函数所组成的计算系统,并在一定的框架环境下,进行数据计算和参数调优的过程
整体来看,**AI通用技术框架主要分为基础层、技术层、应用层三层,**不同公司,在整体框架上都保持一致,只不过针对基础层和技术层的部分内容划分,略有区别,但主旨就是为各类函数组成的计算系统提供环境、数据、算力等支撑,最终达到模型运行并输出结果的目的。**具体到不同层级的主要玩家而言:**1)基础层和技术层的AI框架和算法/架构上,其玩家比较类似,主要是国内外领先的科技巨头、云厂等参与,如谷歌、Meta、微软、亚马逊、阿里、百度、华为等;2)应用层和技术层的工具组件、通用技术,其玩家更加百花齐放,针对行业、场景、功能等各角度发力,推动AI工具和应用的落地。当前,大部分大模型玩家的侧重点更多聚焦于通用技术的提升、应用的领域的拓展。
大模型是什么?大模型的能力如何获取?
大模型是从海量数据中学习并记住泛知识后,在域内数据+提示数据集的修正下,具备在某类具有相对更准确能力的计算系统,其本质是概率模型
据Andrej Karpathy所言,大模型本质由巨大的参数文件+运行参数的代码文件两大核心组件构成。其中:1)参数文件是通过大量数据训练获得的,代表从数据中提取的有用信息和模式(可称为“知识”),其参数量与对知识的记忆能力,与数据量、数据按照不同说明进行曝光的次数有关。2)代码文件有点类似“大脑”,主要是指导参数文件进行推理和产出,其中,可根据域内数据、提示数据集等进行调参,不断提升模型的准确性。因此,总结来看,**大模型能力获得主要有四步:**1)针对大量数据进行预训练,让大模型学习并记住知识;2)明确大模型能力侧重点,即给一定高质量、针对性强的域内数据集微调,让大模型在某些能力更加突出;3)通过标注人员对大模型给出的答案进行排序,给予大模型正向反馈;4)强化学习。以上,也说明大模型的能力不是只要参数量足够大就具备涌现能力,是需要逐项优化才逐步具备某些能力的。需要注意的是,**大模型本质是一个概率模型,**可从2个角度理解:**1)具有不可解释性:**虽然可以调参,但是并不知道这些参数在做什么,如何协同工作,表示的是什么意思;**2)幻觉不可消除:**模型的工作机制是基于概率和统计推断进行的,而非真正的理解和逻辑推理,且与预训练的数据量、曝光次数、微调数据量及数据的选择、奖励函数偏好等息息相关。
大模型在工业应用是否具有可行性?
数据积累、数据资产沉淀等基础以具备,大模型落地工业领域成为可能
大模型的本质是由一系列参数化的数学函数组成的计算系统,是人工智能系统对知识的一种表示和处理方式,本身就具备“数据喂养—认知构建”的“学习”能力。因此,在已经学习海量通用数据、具备一定泛化能力的基础模型的基础上,向其“喂养”特定行业/场景的数据及规则,经过定制开发、调整、训练、调优等操作后,该基础模型将获得特定行业/场景能力的“认知能力”,在一定程度上可称为特定行业/场景大模型。
就工业领域而言,工业互联网、工业智能制造等工作,已经让部分工业领域企业遍历了数据采集-数据存储-数据处理-数据分析-数据资产沉淀-数据应用的过程,部分场景已经准备好了向基础大模型投喂的“数据原料”,当经过数据处理、适配、微调,甚至是训练后,逐步演进为工业大模型,可以解决部分垂直细分场景问题,大模型落地工业成为可能。
工业大模型主要玩家有谁?如何切入市场?
厂商类型多样,覆盖软硬件厂商,基因不同所形成的优势各有侧重,但切入市场的角度类似,在市场竞争打法、客户选择、市场策略等方面趋同
根据基因不同可将工业大模型厂商分为8类:1)互联网大厂、ICT企业、AI厂商,强调AI原生能力和基础大模型能力;2)传统软件厂商凸显客户服务经验、运营资源优势;3)制造大厂、机器人厂商彰显行业know how、行业数据、设备应用等优势;4)安全厂商侧重在企业全局运维中的安全保障。综合来看,虽然各家优势有异,但切入市场的策略相似,即:**锚定自身优势点,围绕具体应用场景摸索大模型在工业的落地性,且目标都是有钱、技术底蕴、有意愿的头部客户。**当前,对比国内外企业的市场切入思路,主要差异有二:1)在合作方上,国外企业具有资源顶端优势,强调从算力底层出发,构建算力-推理的能力地图,而国内企业则强调底层大模型的能力与丰富性;2)在服务思路上,国外企业相对更强调将数据链路服务体系做深,而国内企业更强调各功能模块间的组合。
工业大模型的产业价值流转情况如何?
上游服务方整体集中,且头部效应明显;中游市场参与玩家众,虽服务能力各有侧重,但结合行业know how/行业数据积累进行基础大模型微调、RAG是主要服务思路;下游市场需求广阔,但尚处于探索阶段
工业大模型玩家将如何挣钱?
定制化的综合解决方案是当前核心收费模式,更多收费模式可能需探索
大模型落地于工业领域尚处于萌芽期,其产品形态、服务内容都还在逐步摸索中,其变现方式虽有一些相近服务或行业可以参考,整体不确定性非常高,但一切尝试也都有意义。
工业大模型供给方常规的做法是:与基础大模型厂商合作-测试大模型特点、性能-结合自身产品/能力进行微调-根据客户需求进行客制化服务。因此,**目前相对比较确定的变现方式是类似于“保姆式”的针对某个场景/具体功能的综合解决方案服务收费。**除了定制化的解决方案收费外,部门供给方也开始尝试通过软硬件一体产品进行补充收费。
虽然一些基础大模型的厂商API调用是目前较为普遍的变现方式,但深入到工业大模型服务领域,API调用、智能体调用及分发抽佣等方式的变现还处于积累阶段,目前市场还需要验证。
值得注意的是,大模型的能力具有很强的进化性,2024年9月OpenAI推出的最新的o1版本,表现出比较强的复杂推理能力,这又是扔工智能新水平的一个重要进展。因此大模型未来的能力极限在哪里,我们尚未可知,大模型能为工业领域带来哪些类型的赋能和服务,同样也未知。正是这份未知,未来工业大模型的变现将存在诸多可能。
工业大模型玩家的成长路径为何?
目前尚处于产品雏形期,探讨成长路径为时过早,但很大可能会借鉴工业互联网平台产品-项目-平台的成长路径
工业大模型市场还处于非常初期的阶段,大模型能力更新迭代快,还有非常多尚未可知的潜力,故工业+大模型的应用可能也有无限想象空间。工业大模型的成长路径可借鉴与参考工业互联网平台的,主要原因有2点:1)二者在客户定位、服务内容、服务目标等各方面的重合度比较高;2)当前阶段,工业大模型表现出来的能力,更像是在工业互联网平台的基础上,对数据信息价值的挖掘进一步深入和易用化,服务思路是一致的。但大模型的成长路径也具有极强的不确定性,因为:1)大模型能力具有进化性;2)工业大模型市场仍处于产品雏形期,很多能力仍然停留在产品设想与理论实验阶段,尚未进入真正的工业实践。**因此目前急需解决的是产品-项目的积累与闭环链路构建,**打牢基础后,项目-平台及生态才有机会逐步验证。
大模型落地工业的产品服务架构是怎样的?
模型及服务是大模型落地工业的核心,也是大部分工业大模型厂商对外赋能的基础
大模型落地工业领域的服务框架依然分为基础底座-模型及服务-模型应用三层。其中,模型及服务是核心,主要提供两大类型的服务:1)提供预训练模型,可供其他企业通过调用/部署,提供基础的大模型能力;2)提供预训练模型后服务,如辅助微调、提示工程、训练、压缩、优化等,可供模型能力进一步适配与适用。当前,工业大模型市场的模型应用都是在大模型的基础能力+模型的适配与适用的基础上进行定制衍生的。
大模型落地工业的产品落地模式有哪些?
大模型落地工业时主要以软件为主,但具体产品形态还在摸索中
目前大模型落地工业时的产品切入角度主要有5大类:基础底座、工具、软件服务、硬件产品、硬件赋能。1)基础底座与工具主要由一些基础模型厂商提供,具有较强的头部效应,未来随着大模型能力的提升,有助于赋能软件开发、测试等全流程,以及硬件端的具身智能。**2)针对具体应用时,**以一些工业互联网平台厂商推出为主,但各方尚在探索大模型与自身产品及服务的结合点,产品形态还较为稚嫩,多以基于通用大模型进行微调、RAG验证后形成自己的大模型,然后依附于已经存在的产品(如工业APP)上,单独形成具体应用产品的并不多。未来,随着大模型能力稳定性、准确性提升,大模型有望成为新的流量入口,独立成一个新的产品的也并非不可能。
大模型落地工业的应用场景有哪些?
偏运营的、有一定容错能力的场景是当前重点,生产制造等核心场景的探索需要静待模型进化以及CV大模型、多模态大模型的发展
目前大模型落地工业主要表现为3大特征:1)大模型无法保证输出的准确性,故当前有容错能力的场景是各家探索重点;2)大模型的应用无法脱离行业know how的加持,基本是都是通过微调或者RAG技术进行调整,故**掌握着丰富工业数据、工业机理模型的企业在工业领域将更有优势;**3)目前还是以分析和预测为主,决策还是非常初级的辅助决策,未来控制和应用决策能力的发展需要充分发挥时序数据(如设备、产线运转数据、监控数据等)、IT和OT数据相结合后的价值,故大模型能力进化与其他类型大模型的成熟变的非常迫切。
大模型落地的主要挑战有哪些?
模型本身有缺陷、数据准备不足、应用不够深入等是当前遇到的主要挑战,且各方相互影响
大模型落地工业的挑战主要聚焦于模型、数据、应用、商业变现几方面。针对模型:其根本是模型本身的问题,即存在幻觉、不可解释性、成本高等问题。**针对数据:**更多是数据共享性、数据质量等问题。针对落地应用:则关乎决策成本和应用深度等问题。**针对商业化:**则与前面三大挑战息息相关,即模型与数据相互促进,模型进步将推动应用落地,应用的推进能带来更好的商业化变现。
思考1-大模型落地工业的竞争要素有哪些?
基础能力、模型能力、模型应用是主要竞争点:短期看,具有模型技术优势的企业占优,长期看,则是模型应用更深的企业有望后来居上
大模型落地工业,本质上还是以能解决客户需求为导向。从需求方角度看,客户主要关心两点:结果准确性+服务于业务。因此,对于供给方而言,模型技术与业务理解缺一不可,只不过具有不同基因的企业,在基础能力、模型能力、模型应用这三方面所具备的优势不同,但这三方面是大模型落地的主要竞争要素,且不同发展阶段其相对优势也有所不同。具体而言**:从短期来看**,工业大模型行业是大模型技术发展带来的,以模型技术推动行业发展为主,此时,具有技术优势的企业将占领先机;**从长远来看,**技术本身是为行业服务的,故具有行业know how积累的企业反而能推动行业走的更远,其相对优势将会更加明显。
思考2-工业需要的是大模型还是小模型?
工业大模型与工业专用小模型并存,且是协同融合赋能工业应用的关系
在进行工业应用时,**大小模型各有所长,其能力都不可忽视,当前也不存在谁替代谁的情况。**大模型落地工业应用时,主要依托于强大的生成能力和针对复杂信息的捕捉与构建能力,因此在知识问答、文本/图片生成等以创造见长的场景应用比较多。而小模型则凭借高性价比、预测结果相对准确等优势,在工业质检、设备维护等场景高度成熟。
整体来看,大小模型融合赋能工业应用是必然。**原因主要有二:**其一,大模型除了能有效促进小模型推理能力、鲁棒性性能提升外,还能通过调用的形式充分利用小模型,进一步发挥小模型应用的敏捷性;其二,通过小模型归纳总结业务/场景的运转原理后,可帮助供给方预判针对项目设计的大模型行动方案的可行性,进而降低项目时间和金钱成本。
思考3-工业大模型的服务将会走向平台化?
大模型落地工业的服务平台化特征以开始显现,且逐步形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案
大模型虽然在一定程度上具有泛化能力,但具体到应用时,需要进行微调等操作,其具有很强的定制属性,如何减少重复性工作,甚至减少定制化是各供给方共同探讨的命题。而**行业大模型+智能体+小模型+机理模型为主的平台化调用方案似乎成为大部分企业的共同选择。但有两点需要注意:**1)平台化强调知识沉淀、工具等调用的便捷性,而不拘泥于存储形式/路径;2)大模型工业应用时,其演进具有一定阶段性,基本遵从场景-垂直细分行业-工业领域的路径。
如何学习AI大模型?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓