生成式人工智能重置:从初期热潮到战略扩展

news2025/1/16 3:36:55

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

“是时候对生成式人工智能(生成 AI)进行重置了。随着企业意识到捕捉生成 AI 的巨大潜在价值比预期更困难,2023 年的最初热情和一阵忙碌的活动正在让位于重新思考和重新校准。

2024 年即将成为生成 AI 证明其价值的一年,企业应牢记在数字和 AI 转型中学到的艰难教训:竞争优势来自于建立组织和技术能力,以广泛创新、部署和改进大规模解决方案——实际上,是为了分布式的数字和 AI 创新重新构建业务。

让我们简要看看这对一家太平洋地区的电信公司意味着什么。该公司聘请了一位首席数据和 AI 官,任务是“使组织能够通过数据和 AI 创造价值。”首席数据和 AI 官与业务部门合作,制定了战略愿景并实施了用例的路线图。经过对企业内部领域(即客户旅程或功能)和用例机会的扫描,领导层优先选择了家庭服务/维护领域作为试点,并作为更大一系列举措的一部分进行扩展。他们特别针对开发生成 AI 工具,以帮助调度员和服务操作员更好地预测服务家庭时所需的呼叫类型和零件。

领导层设立了具有共享目标和激励措施的跨职能产品团队来构建生成 AI 工具。作为提升整个企业更好地使用数据和生成 AI 工具技能的一部分,他们还设立了一个数据和 AI 学院,调度员和服务操作员作为培训的一部分报名参加。为了为生成 AI 提供技术和数据基础设施,首席数据和 AI 官还选择了一个大型语言模型(LLM)和能够满足该领域需求并服务于企业其他部分的云提供商。首席数据和 AI 官还监督了数据架构的实施,以便快速且负责任地提供构建生成 AI 工具所需的干净可靠的数据(包括服务历史和库存数据库)。打破生成 AI 机会的关键是公司需要以下列方式重新构建工作方式。

找出生成 AI 助理可以为您提供真正竞争优势的地方


围绕生成 AI 的广泛兴奋及其相对易用性导致了组织内一阵实验热潮。然而,这些举措中的大多数不会产生竞争优势。例如,一家银行购买了数万份 GitHub Copilot 许可证,但由于对如何使用该技术没有清晰的认识,进展缓慢。我们经常看到的另一个无重点的努力是公司试图将生成 AI 纳入其客户服务能力。对于大多数公司而言,客户服务是一种商品能力,而不是核心业务的一部分。尽管生成 AI 可能在此类情况下有助于提高生产力,但它不会创造竞争优势。

要创造竞争优势,公司应首先理解成为“接受者”(使用可用工具,通常通过 API 和订阅服务)、“塑造者”(将可用模型与专有数据集成)和“制造者”(构建 LLM)的区别。目前,对于大多数公司而言,制造者方法成本太高,因此企业的最佳选择是在提高生产力的同时实施接受者模式,并构建塑造者应用以获得竞争优势。

生成 AI 近期价值的很大一部分与其帮助人们更好地完成当前工作的能力密切相关。通过这种方式,生成 AI 工具充当助理,与员工并肩工作,例如创建一个开发人员可以调整的初始代码块,或者起草一个新零件的采购申请单,供现场维护人员审核和提交。这意味着公司应专注于助理技术在其优先计划中可以产生最大影响的地方。

一些工业公司,例如,已经确定维护是其业务的关键领域。审查维护报告并与一线工人共度时光可以帮助确定生成 AI 助理在哪些方面可以产生重大影响,例如快速及早识别设备故障问题。生成 AI 助理还可以更快地识别卡车故障的根本原因并推荐解决方案,并作为最佳实践或标准操作程序的持续来源。

挑战在于如何通过提高生产力来创造收入。例如,在客户服务中心,公司可以停止招聘新代理,并通过自然流失实现潜在的实际财务收益。因此,定义如何通过提高生产力来创造收入的计划对于捕捉价值至关重要。

提高现有人才的技能,但要明确生成 AI 特定技能的需求


目前,大多数公司对所需的技术生成 AI 技能有一个大致的了解,例如模型微调、向量数据库管理、提示工程和上下文工程。在许多情况下,这些是可以通过培训现有员工来发展的技能。那些具备现有 AI 和机器学习(ML)能力的公司有很大的优势。例如,数据工程师可以学习多模态处理和向量数据库管理,ML 操作(MLops)工程师可以扩展其技能到 LLMops(LLM 操作),数据科学家可以发展提示工程、偏见检测和微调技能。

学习过程需要两到三个月才能达到一个相当的熟练水平,因为学习不同 LLM 能做什么和不能做什么以及如何最好地使用它们的复杂性。编码人员需要获得构建软件、测试和验证答案的经验。例如,一家金融服务公司花了三个月时间培训其最好的数据科学家达到高水平的熟练度。尽管课程和文档是可用的——许多 LLM 提供商为开发人员提供训练营——我们发现,通过学徒制、大规模培训人员以便培训他人以及建立从业者社区是最有效的能力建设方式。通过在团队之间轮换专家进行培训,定期安排会议分享学习成果,并举办每两周一次的文档审查会议,这些做法在建立从业者社区方面取得了成功。

成功的生成 AI 技能不仅仅是编码熟练度。我们在开发自己生成 AI 平台 Lilli 的过程中发现,最好的生成 AI 技术人才具备设计技能,能够发现需要解决的问题,具备上下文理解能力,确保生成最相关和高质量的答案,具备与知识专家合作的能力(测试和验证答案并制定适当的策划方法),具备强大的取证技能,能够找出故障原因(问题是数据、用户意图的解释、元数据的质量还是其他原因),具备预见能力,能够构思和规划可能的结果并将正确类型的跟踪纳入代码。纯粹的编码人员如果没有这些技能,可能不会是团队中有用的成员。

尽管目前的技能提升主要基于“在职学习”方法,但我们看到市场迅速出现了过去一年学到这些技能的人。技能增长迅速。GitHub 报告称,开发人员正在“大量”参与生成 AI 项目,2023 年在其平台上创建了 65,000 个公共生成 AI 项目,比前一年增长了近 250%。如果您的公司刚刚开始生成 AI 之旅,您可以考虑雇佣两到三名为其公司构建生成 AI 塑造产品的高级工程师。这可以大大加快您的进展。

组建集中团队以建立标准,实现责任扩展


为了确保业务的各个部分都能扩展生成 AI 能力,集中技能是一个自然的第一步。该集中团队的关键重点将是制定并实施支持扩展的协议和标准,确保团队能够访问模型,同时将风险降至最低并控制成本。团队的工作可以包括,例如,采购模型并规定访问方式,制定数据准备标准,建立已批准的提示库,分配资源。

对于开发生成 AI 解决方案的团队,其团队组成将类似于 AI 团队,但会有具有生成 AI 经验的数据工程师和数据科学家,并且风险管理、合规和法律职能的贡献者更多。通常的做法是从不同专业领域分配资源到小组,这种理念不会改变,但生成 AI 密集型小组的技能组成会有所不同。

设置技术架构以扩展


构建生成 AI 模型通常相对简单,但要使其在大规模上全面运行则完全不同。我们见过工程师在一周内构建一个基本的聊天机器人,但发布一个稳定、准确且合规的版本以扩展可能需要四个月时间。这就是为什么我们的经验表明,实际的模型成本可能不到解决方案总成本的 10% 到 15%。

构建扩展不意味着构建新技术架构。但这确实意味着关注一些核心决策,以简化和加快流程,而不会造成巨大开支。以下三项决策尤为重要:

关注重用技术。重用代码可以使生成 AI 用例的开发速度提高 30% 到 50%。一个好的方法是简单地创建一个已批准工具、代码和组件的来源。例如,一家金融服务公司创建了一个生产级工具库,经过安全和法律团队的批准,并在库中提供给团队使用。更重要的是花时间识别和构建在最优先用例中常见的能力。例如,同一家金融服务公司确定了三个组件,可以重用于 100 多个已识别的用例。通过首先构建这些组件,他们能够为所有已识别的用例生成大量代码库——实际上给每个应用程序一个很大的起步。

将架构重点放在使生成 AI 模型与内部系统之间的高效连接上。为了使生成 AI 模型在塑造者原型中有效工作,它们需要访问企业的数据和应用程序。集成和编排框架的进步显著减少了进行这些连接所需的工作量。但关键是要明确这些集成是什么以及如何实现它们,以确保这些模型高效工作,避免复杂性造成的技术债务(公司在解决现有技术问题时支付的时间和资源“税”)。首席信息官和首席技术官可以为其组织定义参考架构和集成标准。关键要素应包括一个模型中心,包含经过训练和批准的模型,可以按需提供;标准 API,充当连接生成 AI 模型与应用程序或数据的桥梁;以及上下文管理和缓存,通过提供来自企业数据源的相关信息加速处理。

建立测试和质量保证能力。我们在构建 Lilli 的过程中,优先考虑了测试而不是开发。我们的团队不仅开发了每个开发阶段的测试协议,还协调了整个团队,例如,明确谁具体需要对每个阶段的过程进行签字。这虽然减慢了最初的开发速度,但通过减少错误和修复错误所需的时间,加快了整体交付速度和质量。

确保数据质量并关注非结构化数据以支持模型


企业能否从生成 AI 模型中生成和扩展价值将取决于其利用自身数据的能力。与技术一样,现有数据架构的针对性升级是为了最大化生成 AI 的未来战略收益:

针对性地提高数据质量和数据增强工作。虽然数据质量一直是一个重要问题,但生成 AI 模型可以使用的数据的规模和范围——特别是非结构化数据——使这个问题变得更加重要。因此,关键是要正确处理数据基础,从明确决策权到定义明确的数据流程,再到建立模型可以访问的数据分类。做得好的公司将其数据质量和增强工作与特定的 AI/生成 AI 应用和用例联系起来——您不需要将这种数据基础扩展到企业的每个角落。这可能意味着,例如,开发一个新的数据存储库,包含所有设备规格和报告的问题,以更好地支持维护助理应用。

了解非结构化数据中锁定的价值。大多数组织传统上专注于结构化数据(可以组织成表格的值,例如价格和特性)。但 LLM 的真正价值来自其处理非结构化数据的能力(例如,PowerPoint 幻灯片、视频和文本)。公司可以绘制哪些非结构化数据源最有价值,并建立元数据标记标准,以便模型可以处理数据,团队可以找到所需的内容(标记尤其重要,有助于公司在必要时从模型中删除数据)。在考虑数据机会时要有创造性。一些公司,例如,在高级员工退休时采访他们,并将捕获的机构知识输入 LLM,以帮助改善其助理性能。

优化以降低大规模成本。企业在数据上的花费与他们优化数据基础设施和基础成本后的花费之间往往有十倍的差距。这一问题通常源于公司在未优化数据方法的情况下扩展概念验证。通常有两项成本突出。一是存储成本,公司将数 TB 的数据上传到云端并希望这些数据 24/7 可用。实际上,公司通常只需要 10% 的数据具有这种可用性水平,而在 24 或 48 小时内访问其余数据是更便宜的选择。另一个成本与需要调用数千个处理器运行的模型计算相关。这尤其适用于公司构建自己的模型(制造者原型),但也适用于使用预训练模型并使用自己的数据和用例运行它们(塑造者原型)。公司可以仔细研究如何在云平台上优化计算成本——例如,将一些模型排队在处理器未使用时运行(例如,当美国人睡觉,Netflix 等计算服务消费减少时)是一种更便宜的选择。

建立信任和可重用性以驱动采用和扩展


由于许多人对生成 AI 有担忧,解释这些工具如何工作比大多数解决方案的要求更高。使用这些工具的人想知道它们如何工作,而不仅仅是它们做什么。因此,投资额外的时间和金钱以通过确保模型准确性和简化检查答案来建立信任非常重要。

例如,一家保险公司创建了一个生成 AI 工具来帮助管理索赔。作为该工具的一部分,它列出了所有已实施的保护措施,并为每个答案提供了指向相关政策文件句子或页面的链接。该公司还使用 LLM 生成了许多相同问题的不同变体,以确保答案的一致性。这些步骤在帮助最终用户建立对工具的信任方面至关重要。

培训使用生成 AI 工具的维护团队的一部分应该是帮助他们了解模型的局限性以及如何最好地获得正确答案。这包括教导工人以更广泛的问题开始然后逐步缩小范围以快速获得最佳答案。这为模型提供了更多的上下文,也有助于消除可能自认为已经知道答案的人的偏见。让模型界面看起来和感觉与现有工具相同也有助于用户在引入新应用程序时不感到压力。

要实现扩展,企业需要停止构建难以用于其他类似用例的单一解决方案。例如,一家全球能源和材料公司将可重用性作为所有生成 AI 模型的关键要求,并在早期迭代中发现其组件的 50% 到 60% 可以重用。这意味着要为开发生成 AI 资产(例如提示和上下文)设置标准,以便其他用例可以轻松重用。

尽管许多与生成 AI 相关的风险问题是已经在讨论中的进化——例如数据隐私、安全、偏见风险、工作替代和知识产权保护——生成 AI 极大地扩展了风险范围。报告 AI 采用的公司中只有 21% 表示他们已经制定了管理员工使用生成 AI 技术的政策。

同样,应该建立一套测试 AI/生成 AI 解决方案的测试,以证明数据隐私、消除偏见和知识产权保护得到了尊重。一些组织实际上建议发布附带性能特征文档的模型。记录您的决策和理由在与监管机构的对话中特别有帮助。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1810532.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DSP28335模块配置模板系列——定时器中断配置模板

一、配置步骤: 1.使能定时器时钟 EALLOW;SysCtrlRegs.PCLKCR3.bit.CPUTIMER2ENCLK 1; // CPU Timer 2EDIS; 2.设置定时器的中断向量 EALLOW;PieVectTable.TINT2 &TIM2_IRQn;EDIS;其中TIM2_IRQn时定时器中断服务程序的名称 ,将中断服务函数的地址…

【面试干货】聚集索引和非聚集索引区别?

【面试干货】聚集索引和非聚集索引区别? 1、聚集索引(Clustered Index)1.1 特点1.2 例子 2、非聚集索引(Nonclustered Index)2.1 特点2.2 例子 3、根本区别 💖The Begin💖点点关注,收藏不迷路&…

[Vue3:组件通信)子组件props接收和watch监听,emit发送父组件 (添加修改设置成绩,添加、删除选课记录)

文章目录 一:系统功能:设置成绩(添加或修改)交互逻辑:涉及页面 Page02.vue,ModalEdit.vue主页面Page.vue注入子页面,使用子页面标签属性主页面对子页面做通信,子页面ModalEdit接收参…

在win11系统上安装启动Hyper-V

Hyper-V 是微软公司开发的一种虚拟化技术,它允许一台物理计算机运行多个操作系统和应用程序,从而提供更好的资源利用率和系统灵活性。 win系统的linux子系统开启、android studio的虚拟环境都需要这个东西,而在初始的win11系统上可能没有这个…

CTFHUB-SQL注入-时间盲注

本题用到sqlmap工具,没有sqlmap工具点击🚀🚀🚀直达下载安装使用教程 理论简述 时间盲注概述 时间盲注是一种SQL注入技术的变种,它依赖于页面响应时间的不同来确定SQL注入攻击的成功与否。在某些情况下,攻…

Ansible离线部署 之 Zabbix

Ansible介绍 Ansible 是一个自动化平台,用于 IT 自动化,如配置管理、应用部署、任务自动化等。Ansible 使用 SSH 来连接到远程机器,并执行预定义的任务。Ansible 的主要特点是其简单性、易用性和强大的功能集。 以下是 Ansible 的一些关键特…

DeepSpeed MoE

MoE概念 模型参数增加很多;计算量没有增加(gating小FNN,比以前的大FNN计算量要小);收敛速度变快; 效果:PR-MoE > 普通MoE > DenseTransformer MoE模型,可视为Sparse Model&…

视频点播系统的设计

管理员账户功能包括:系统首页,个人中心,管理员管理,客服聊天管理,基础数据管理,论坛管理,公告管理 前台账户功能包括:系统首页,个人中心,论坛,视…

为什么使用Java8中的并行流运算耗时变长了?

写在文章开头 近期对迭代的功能进行压测检查,发现某些使用并发技术的线程任务耗时非常漫长,结合监控排查定位到的并行流使用上的不恰当,遂以此文分享一下笔者发现的问题。 Hi,我是 sharkChili ,是个不断在硬核技术上作…

虚假RE:Runtime Error

简单数据处理 筛法求素数 描述 用筛法求2——N之间的素数 输入描述 输入一个整数N&#xff0c;2<N<100000 输出描述 输出[2——N]区间内的素数 用例输入 1 20 用例输出 1 2 3 5 7 11 13 17 19 把判断素数写出一个函数&#xff0c;方便后续直接使用 #include<stdio.…

头部外伤怎么办?别大意,科学处理是关键

头部外伤是一种常见的伤害&#xff0c;它可能由跌倒、撞击或其他事故造成。虽然许多头部外伤看似轻微&#xff0c;但如果不妥善处理&#xff0c;可能会带来严重的后果。因此&#xff0c;了解头部外伤的处理方法至关重要。 一、初步判断伤势 头部外伤后&#xff0c;首先要观察伤…

自动驾驶---Perception之视觉点云雷达点云

1 前言 在自动驾驶领域&#xff0c;点云技术的发展历程可以追溯到自动驾驶技术的早期阶段&#xff0c;特别是在环境感知和地图构建方面。 在自动驾驶技术的早期技术研究中&#xff0c;视觉点云和和雷达点云都有出现。20世纪60年代&#xff0c;美国MIT的Roberts从2D图像中提取3D…

Vuepress 2从0-1保姆级进阶教程——标准化流程(Tailwindcss+autoprefixer+commitizen)

Vuepress 2 专栏目录【已完结】 1. 入门阶段 Vuepress 2从0-1保姆级入门教程——环境配置篇Vuepress 2从0-1保姆级入门教程——安装流程篇Vuepress 2从0-1保姆级入门教程——文档配置篇Vuepress 2从0-1保姆级入门教程——主题与部署 2.进阶阶段 Vuepress 2从0-1保姆级进阶教程—…

【递归+二叉树思想+搜索】 Alice and the Cake题解

Alice and the Cake题解 AC记录&#xff1a;记录-洛谷 题面翻译&#xff08;大概就是题目大意&#xff09; 执行恰好 n − 1 n-1 n−1 次操作&#xff0c;每次操作可以选择当前所有蛋糕中满足其重量 w ⩾ 2 w\geqslant 2 w⩾2 的一块&#xff0c;然后将其分为质量分别为 …

vue + vite 图标导入总结

vue vite 图标导入总结 SVG 的使用 在页面中我们会使用到各种图标&#xff0c;为了保证图标在放大缩小不失真&#xff0c;通常会采用 SVG 来作为图标。 SVG&#xff08;Scalable Vector Graphics&#xff09;是一种基于XML的矢量图像格式&#xff0c;它可以用来创建清晰的、…

计算机组成原理之计算机的性能指标

目录 计算机的性能指标 复习提示 1.计算机的主要性能指标 1.1机器字长 1.1.1与机器字长位数相同的部件 1.2数据通路带宽 1.3主存容量 1.4运算速度 1.4.1提高系统性能的综合措施 1.4.2时钟脉冲信号和时钟周期的相关概念 1.4.3主频和时钟周期的转换计算 1.4.4IPS的相关…

图神经网络实战(13)——经典链接预测算法

图神经网络实战&#xff08;13&#xff09;——经典链接预测算法 0. 前言1. 链接预测2. 启发式技术2.1 局部启发式技术2.2 全局启发式技术 3. 矩阵分解小结系列链接 0. 前言 链接预测 (Link prediction) 可以帮助我们理解和挖掘图中的关系&#xff0c;并在社交网络、推荐系统等…

javaweb请求响应+@ResponseBody注解

这里用了一款接口测试软件postman 简单参数 SpringBoot方式 简单参数:参数名与形参变量名相同&#xff0c;定义形参即可接收参数。 请求参数名与方法形参变量名相同 会自动进行类型转换 package com.example.springbootwebreqresp.Controller;import org.springframework.w…

Go微服务: 理解分布式锁

概述 我们先看一个场景&#xff0c;到了双11&#xff0c;我们的商户又开始卖商品啦但是&#xff0c;我们的库存是有限的&#xff0c;如果超卖了&#xff0c;可能平台就会涉及相关法律责任了所以&#xff0c;我们的库存扣除问题&#xff0c;一定是一个非常经典的问题 先看上图&…

《Vue》系列文章目录

Vue (发音为 /vjuː/&#xff0c;类似 view) 是一款用于构建用户界面的 JavaScript 框架。它基于标准 HTML、CSS 和 JavaScript 构建&#xff0c;并提供了一套声明式的、组件化的编程模型&#xff0c;帮助你高效地开发用户界面。无论是简单还是复杂的界面&#xff0c;Vue 都可以…