玩转大模型行业应用,且看盘古大模型全栈工程能力展身手【云驻共创】

news2024/11/17 8:53:56

AI技术在金融和工业领域的应用不断扩展,促进了金融行业的数字化转型和产业升级。AI提供了专属财富管家和工业范式的解决方案,在金融领域的应用包括风险评估和投资建议,而在工业领域的应用则涵盖了数据分析和机器人操作。与此同时,开发者在AI的应用创新中发挥着重要作用,通过编写代码将创意变为现实。GTC cloud 2023 AI专题论坛汇集了众多技术大佬,共同探讨了AI在十大热门领域的应用。

本文介绍了华为盘古大模型在工程方面面临的四个挑战,分别是数据处理、数据质量、跨领域和训练难度。华为通过三年的时间,在多个行业大模型项目中积累了工程能力,并总结出了数据工程套件、模型开发套件和应用开发套件。盘古大模型提供了五类大模型和不同参数量的模型供开发者选择,并介绍了一些增强模型的案例。本文还介绍了大模型数据清洗所面临的挑战,以及华为的大数据计算平台和自动化模型清洗技术的应用。最后,本文讨论了数据标注平台的优化提升和盘古大模型的安全与可信的挑战,并分享了治理大模型的重要性和方法。

一.AI在金融和工业领域的应用

AI技术在金融和工业领域的应用不断扩展,促进了金融行业的数字化转型和工业升级。AI提供了专属财富管家和工业范式的解决方案,在金融领域的应用包括风险评估和投资建议,而在工业领域的应用则涵盖了数据分析和机器人操作。与此同时,开发者在AI的应用创新中发挥着重要作用,通过编写代码将创意变为现实。GTC cloud 2023 AI专题论坛汇集了众多技术大佬,共同探讨了AI在十大热门领域的应用。

GTC cloud 2023AI专题论坛,我们聚焦十大热门领域,汇集众多技术大佬和大家在线交流分享。AI开发生产线model once 0代码玩转AI开发AIGC用技术重塑艺术形态,天成AI求解器,对话就能实现智能建模的AI求解器,巨神智能大机器人。韩国大模型驱动的企业级搜索,让搜索更懂你,玩转大模型行业应用。且看盘古大模型全栈工程能力展身手,宣传行业将A应用于千行百业的核心系统,AI到医药药物研发,实现从马拉松到加速跑。

1.1华为盘古大模型的工程挑战

本文介绍了华为盘古大模型在工程方面面临的四个挑战,分别是数据处理、数据质量、跨领域和训练难度。数据量庞大且处理繁杂,数据质量参差不齐,不同行业和多模态数据都需要处理。模型训练难度大,需要引入大规模分布式训练并解决底层通信和编码问题。应用开发落地困难,需要适配不同的开源模型和API接口。同时还需要解决合规风险和内容版权问题。

华为通过三年的时间,在多个行业大模型项目中积累了工程能力,并总结出了数据工程套件、模型开发套件和应用开发套件。数据工程套件包括数据获取、标注平台、数据清洗等功能,提高了模型训练的效率和数据管理的安全性。通过数据管理平台,可以对数据进行管理和溯源,方便后续算法问题的溯源。

套件提供了向导式和界面化的开发工具,从数据集管理到模型训练、评测、评估,再到模型推理上线,全流程都提供了支持。同时,套件还提供了强化学习和自监督训练等功能,底层接近AI平台层面也有一些亮点,比如容错训练和量化推理。此外,套件还解决了模型部署开发的成本和开发者关心的集成到企业应用的问题,提供了SDK和应用开发平台来实现业务编排和调优调试。最后,套件还提供了数据安全和模型安全的四重防护措施。

1.2盘古工程能力套件和数据标注清洗工程实践

主要介绍了盘古工程能力套件的总结和即将启动的邀测,以及数据标注和清洗工程的重要性。讲者刘威介绍了大模型在训练过程中所需的丰富数据,包括文本、图片、音频视频,并强调了数据的质量和规模对模型的影响。他还介绍了盘古工程在数据标注和清洗方面的工程实践,以及行业中的清洗平台、标注平台和管理平台。

大模型的需要的数据有以下三个特点,大规模、高质量、丰富性。大规模在模型一定的情况下,我们可以提升数据的规模,来提升模型的训练效果。大规模可以理解为我们要让模型多读书,读的书越多它的效果越好。高质量的数据可以让模型高质量的数据可以让模型的可解释性更好。

本方向介绍了大模型数据清洗所面临的挑战,如大数据量、非结构化数据、敏感数据和广告文本等。并介绍了一套数据工程架构,包括采集平台、标注平台、清洗平台和数据管理,以及具体的清洗流程。同时,还介绍了华为的大数据计算平台和自动化模型清洗技术的应用。最后,讨论了数据标注平台的优化提升。

1.3 NLP大模型开发流程及工具

NLP大模型开发的流程和使用的三个工具,包括自监督学习工具、有监督微调和强化学习。模型部署方式,包括纯在线部署和脱敏数据上云部署。

首先其实对于盘古NLP大模型来讲,基础的LLM的能力其实盘古大模型都具备。包括我们最熟知的这些文案生成,或者对话问答相关的内容。当然我们其实在平台上相关的刚刚提到像思考增强能力,以及是很多符号引擎插件执行的能力,我们都可以在平台上体验到。那怎么去针对这样的一些能力和不同的功能点做二次开发,其实我们给大家准备的是三个工具。其实大模型本身的开发流程会比较的通用化,就我们可以通,不管是您是什么样的任务进来,我们可以通过三个工具链都可以去实现相关的开发任务。

第一个工具其实是自监督学习的工具。它的目的其实是为了把这些行业数据快速导入到模型里面去,让模型具备行业或者企业的知识。

在获取这个模型以后,我们可以通过有监督微调的方式,去对不同的任务做相关的指定优化。因为企业可能我的客服部门和我的财务部门,它所需要去执行的任务其实是不一样的。那些任务可以通过一些高质量的已被已经标注过的数据,但是少量且高质量的数据就可以去做相关的优化。可以基于我们通过自监督学习获取到的这样的一个模型做优化,也可以基于我们的基础模型直接去做相关的优化。模型上线以后,通过运行和用户反馈,我们可以通过强化学习的方式做二次的优化,以及是可能包括像安全加固相关的能力,都可以用强化学习来实现。

1.4使用华为盘古应用开发套件构建AM应用的快捷方法

使用华为盘古应用开发套件构建AM应用的方法和能力。华为的盘古大模型已经在多个行业的多个场景下支持AI应用落地。通过SDK和两个平台,开发者可以提高M应用的开发效率。SDK提供了memory和skill模块,帮助大模型记住已回答过的问题和完成特定任务。统一的配置能力和prompt模板可以让开发者屏蔽下层各类模型的调用细节,实现自由分享和传播。编排能力可以使用各种工具和技能解决复杂问题。

我们为开发者提供了一个SDK和两个平台。我们的SDK可以极大地帮助开发者提升开发一个M应用的效率。它包含memory prompt skill,MS planner to这几个模块。

1.5 大模型的数据安全与模型符合人类价值观

大模型使用过程中的数据安全措施,包括数据提取、传输、分级分类管理等。同时讨论了模型的安全性,重点是如何使模型符合人类价值观,包括预训练阶段添加符合道德的数据和价值观的prompt,强化学习阶段的评价和语料优化,以及知识图谱在推理阶段的应用。包括了对用户输入输出的审核和内容监控机制。

总的来说,AI技术在金融和工业领域的应用持续扩展,为数字化转型和产业升级提供了强大的工具。华为盘古大模型在面对工程挑战时,通过积累工程能力和提供多层套件解决方案,为开发者和企业提供了更多的可能性。这些工程能力套件的提供不仅加速了大模型的开发和部署过程,还强调了数据安全和模型符合人类价值观的重要性。

在AI技术的快速发展中,继续探索和解决工程挑战,确保数据的质量和安全性,以及模型的可解释性和道德性,将是不可或缺的一部分。通过技术创新和工程实践,AI将继续推动金融和工业领域的发展,创造更多价值和机会。 GTC cloud 2023 AI专题论坛是一个重要的平台,汇集了技术领域的专家,共同探讨AI在各个领域的前沿应用,推动着AI技术的不断演进,为未来的发展铺平了道路。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1235365.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【代数学习题4.2】从零理解范数与迹 —— 求数域元素的范数与迹

从零理解范数与迹 —— 求数域元素的范数与迹 写在最前面题目解答 2. 范数 N N N思路求解过程python求解 3. 数域 K K K 的范数 N K N_K NK​思路求解过程Python求解分析解题步骤 4. 迹 T T T求解过程共轭元素计算迹 python求解分析解题步骤 5. 数域 K K K 的迹 T K T_K …

第三届VECCTF-2023 Web方向部分wp

拳拳组合 题目描述&#xff1a;明喜欢保存密钥在某个文件上。请找到秘钥并读取flag文件。 开题&#xff0c;点不完的。源码提示&#xff1a; <!--据说小明很喜欢10的幂次方--> 扫一下看看&#xff0c;应该是有git泄露。 其它一些路由没什么用 git泄露拿下一堆码 pytho…

【Seata源码学习 】篇三 TM开启全局事务的过程

【Seata源码学习 】篇三 TM开启全局事务的过程 TM发送 单个或批量 消息 以发送GlobalBeginRequest消息为例 TM在执行拦截器链路前将向TC发送GlobalBeginRequest 消息 io.seata.tm.api.DefaultGlobalTransaction#begin(int, java.lang.String) Overridepublic String begin(…

微信小程序开发学习——顺序、选择、循环、数学函数

1.条件语句 只需在js中写JavaScript的条件语句就行 math对象&#xff1a; 代码如下&#xff1a; <!--pages/tiaojian/tiaojian.wxml--> <view class"box"><view class"title">输入x&#xff0c;条件输出y</view><view><…

MT8735/MTK8735安卓核心板规格参数介绍

MT8735核心板是一款高性能的64位Cortex-A53四核处理器&#xff0c;设计用于在4G智能设备上运行安卓操作系统。这款多功能核心板支持LTE-FDD/LTE-TDD/WCDMA/TD-SCDMA/EVDO/CDMA/GSM等多种网络标准&#xff0c;同时还具备WiFi 802.11a/b/g/n和BT4.0LE等无线通信功能。此外&#x…

Windows + Syslog-ng 发送eventlog 到Splunk indexer

1: 背景: 装了window Splunk universal forwarder 的 window server 要把event log 送到linux 的splunk indexer 上,由于网络的原因,不能直接发送数据到splunk indexer的话,要利用跳板机来实现: 2:架构: 3: 先说明每个类型server 上的安装情况: Window server: 安装S…

前端css粘性布局,顶部吸附效果(position: sticky)

sticky属性设置 /* 设置粘性布局 */ position: sticky; /* 拖动滚动条&#xff0c;当前元素超出文档0的位置时&#xff0c;触发定位效果&#xff08;同级元素位置不会受影响&#xff09; */ top: 0;页面初始效果 设置前&#xff08;滚动页面时&#xff0c;标签栏随页面滚动&a…

人工智能时代:深入了解与学以致用的智能科技

目录 前言人工智能的领域1. 医疗健康2. 交通与智能驾驶3. 教育领域4. 金融与人工智能5. 制造业与自动化 人工智能的应用1. 智能手机与语音助手2. 智能家居系统3. 自动驾驶汽车4. 医疗诊断与治疗5. 金融风控与预测分析 对人工智能的看法1. 科技的利弊2. 伦理和隐私问题3. 人工智…

树与二叉树堆:二叉树

二叉树的概念&#xff1a; 二叉树是树的一种&#xff0c;二叉树是一个节点&#xff0c;最多只有两个子节点&#xff0c;二叉树是一个特殊的树二叉树的度最大为2 从上图可得一棵二叉树是结点的一个有限集合&#xff0c;该集合: 或者为空由一个根结点加上两棵别称为左子树和右子…

【软考】文件的组织结构

目录 一、说明二、逻辑结构2.1 说明2.2 记录式文件2.2.1 说明2.2.2 顺序文件2.2.3 索引文件2.2.4 索引文件 2.3 流式文件 三、物理结构3.1 说明3.2 链接方式之隐式链接3.3 链接方式之显式链接 一、说明 1.组织结构是文件的组织形式。 2.逻辑结构为用户可见的的文件结构。 3.物理…

8Base集团通过SmokeLoader部署新的Phobos勒索软件变种

最近&#xff0c;8Base集团的威胁行为者通过Phobos勒索软件的变种展开了一系列金融动机的攻击。这一发现来自于思科Talos的研究结果&#xff0c;他们记录了网络犯罪分子活动的增加。 安全研究员Guilherme Venere在周五发表的详尽的两部分分析中表示&#xff1a;“该组织的大多…

OpenGL_Learn14(光照贴图)

1. 漫反射贴图 在光照场景中&#xff0c;它通常叫做一个漫反射贴图(Diffuse Map)&#xff08;3D艺术家通常都这么叫它&#xff09;&#xff0c;它是一个表现了物体所有的漫反射颜色的纹理图像。 我们会将纹理储存为Material结构体中的一个sampler2D 。我们将之前定义的vec3漫反…

元素定位与选择器

元素定位与选择器 做元素定位时&#xff0c;你是否曾遇到过以下难题 元素 ID 或 class 是动态生成的你使用了 CSS选择器去定位&#xff0c;但开发把元素CSS样式改掉了 这种情况下通常会测试失败 Cypress 如何解决上述难题 提供了 data-* 属性&#xff0c;包含了下面三个定…

阿里8年经验之谈 —— 分享一次接口性能摸底测试过程!

接口性能测试是用于验证应用程序中的接口是否可以满足系统的性能要求的一种测试方法。确定应用程序在各种负载条件下的性能指标&#xff0c;例如响应时间、吞吐量、并发性能等&#xff0c;以便提高系统的性能和可靠性。本文主要讲述接口性能测试从前期准备、方案设计到环境搭建…

数字化转型导师坚鹏:数字化时代银行网点厅堂营销5大关键点分析

数字化时代银行网点厅堂营销需要抓住以下5大关键点&#xff1a; 1、精准识别客户&#xff1a;在数字化时代&#xff0c;银行网点厅堂营销的关键在于精准识别客户。通过利用大数据和人工智能技术&#xff0c;银行可以分析客户的行为和需求&#xff0c;从而更好地了解客户&#…

Win10 电源选项那选择“关闭显示器“为1分钟,1分钟后就锁屏了?怎么才能关闭显示器后不锁屏

环境&#xff1a; Win10专业版 问题描述&#xff1a; Win10 电源选项那选择"关闭显示器"为1分钟&#xff0c;1分钟后就锁屏了&#xff1f;怎么才能关闭显示器后不锁屏 解决方案&#xff1a; 方法一 更改注册表可以实现关闭显示器而不锁屏的效果。请按照以下步骤…

雷电模拟器报错:g_bGuestPoweroff.fastpipeapi. cpp_1153_1161

文章目录 一、报错详情&#xff1a;二、解决&#xff1a;【1】设置Windows功能【2】设置cmd&#xff08;管理员身份&#xff09;【3】重启电脑 三、windows10其中1809版本出现1153、1161&#xff0c;需要关闭内核隔离 一、报错详情&#xff1a; 二、解决&#xff1a; 【1】设置…

go语言学习之旅之Go 语言指针

学无止境&#xff0c;今天继续学习go语言的基础内容 Go语言支持指针&#xff0c;允许你在程序中直接操作变量的内存地址。指针存储了变量的内存地址&#xff0c;通过指针&#xff0c;你可以直接访问或修改该地址上的值。 学习过c语言的一定知道指针 定义指针 在Go语言中&…

卷积神经网络(ResNet-50)鸟类识别

文章目录 卷积神经网络&#xff08;CNN&#xff09;mnist手写数字分类识别的实现卷积神经网络&#xff08;CNN&#xff09;多种图片分类的实现卷积神经网络&#xff08;CNN&#xff09;衣服图像分类的实现卷积神经网络&#xff08;CNN&#xff09;鲜花的识别卷积神经网络&#…

芯片IO口不加电阻会怎样?

芯片IO口不加电阻会怎样&#xff1f; 可能会导致以下几个后果&#xff1a; 1.高电流问题&#xff0c;IO口没有电阻限流&#xff0c;当与外部设备直接连接时&#xff0c;就可能会导致过大的电流流过IO口&#xff0c;这就可能损坏IO口&#xff0c;引起短路或烧坏其它电路组件。像…