天翼云,AI取经路上的逐梦人

news2024/11/16 12:33:08

fd5890fffac625829ab8684c352234b8.gif

08e89358749f36995fdb1c218acfaa61.png

最近,国产第一部3A游戏大作《黑神话:悟空》问世,引发了全网热潮。游戏中的主角,重走西游之路,克服重重难关,向世界展现了中国文化的绝美与中国科技的自信。

而在现实当中,通往产业智能化的AI之路,同样可以说是一条取经之路。广大行业大模型开发者,也像“取经人”一样需要跨越重重难关,克服九九八十一难。那么,谁能来帮助他们攻克艰险,踏上灵山?

47e8b824b1f880551444ffcdbc2c0542.jpeg

9月4日,天翼云在线上举办了息壤一体化智算服务平台大模型训推服务能力升级发布会。面向行业大模型的真实开发需求与应用场景,天翼云将2023年推出的智算服务平台进行了升级与革新,从而能够为大模型开发训练、行业模型微调提供全生命周期的工具链。

经过一年的精进,天翼云智算服务平台具有全流程覆盖、全方位支持、适配国内行业大模型AI开发需求的特性。旨在简化大模型从训练到部署整个流程的息壤一体化智算服务平台,已经可以在AI取经之路上,助力每一位行业大模型开发者“取经人”。

作为云服务国家队,天翼云所打造的息壤一体化智算服务平台训推服务能力的跃迁,正在帮助中国AI开发者踏上智能化之路,盎然西行,直面天命。

9058136fe1e71cc04a8b6625c27c2c81.png

就像西天取经之路一样,大模型开发者与千行百业的AI进阶之路,需要面临重重艰险。从AI大模型训练所需的数据准备,到模型训练、推理部署,每一个环节对于行业大模型开发者来说都蕴藏着不小的挑战。我们可以拣选具有代表性的几个“AI取经难关”进行讨论:

b0abe0efaf497cc9697275fceac3a2e8.png

1.数据的黑风山。

AI大模型训练需要大量高质量数据,但对于行业大模型开发者来说,AI所需的优质数据获取难度其实是非常大的。在各行各业中,数据资源呈现出极其有限,且分布非常分散的特点。在收集到一定的数据之后,开发者还需要面对数据标注、数据清洗等一系列工作,开发成本极大。除此之外,行业大模型开发者还需要与行业内的专家紧密配合,从而将专业知识与AI算法进行紧密结合。这些行业数据相关的难题,构成了一座重重险阻的“黑风山”,成为阻挡开发者踏上AI取经路的第一道难关。

2.训练的狮驼岭。

在化解数据难题之后,开发者还需要面对AI大模型训练这个关键环节,而这个环节也是综合成本开销最大,且不确定性最高的一个。

对于行业大模型开发者来说,大模型训练面临着AI算力稀缺的核心问题,而在极高的AI算力成本之下,还需要应对传统算子运行效率差、训练集群故障多、故障定位与恢复时间漫长等重重困难。极高的训练难度和训练稳定性,成为困扰大模型智能化发展的高山。

3.模型的通天河。

对于众多行业领域来说,进行独立的大模型研发并非唯一选择,如果能够基于先进、成熟的大模型再结合自身行业所需进行“定制化”开发可取得事半功倍的效果。然而在这种需求下,行业模型开发者也面临着业界优秀的模型与模型应用实践难以获取,模型的本地化水平低等问题。模型的应用部署,限制住了大模型在行业智能化的“最后一公里”。

能不能找到一个方法,连续攻克这重重难关,给予行业大模型开发者一站式的帮助?

面对这个问题,能够一站式全流程覆盖的智算服务平台成为关键的答案。天翼云对息壤一体化智算服务平台训推服务能力的升级,就是希望瞄准真实的行业大模型开发,与开发者一起踏破AI取经的九九八十一难。

72374e263efbf92ce27ca1019791b717.png

西天取经需要一步步走,一关关过。对行业大模型开发的赋能,也需要了解每个环节行业大模型开发者真正面对的挑战,给出具有突破性的解决方案。

息壤一体化智算服务平台训推服务能力升级的特点,就是洞察真实的行业AI大模型开发工作的诉求,针对每个环节都给出对应的解法。我们可以将天翼云息壤一体化智算服务平台训推服务能力的演进,分为多个层面进行理解。看看天翼云如何帮助AI路上的“取经人”,一步步踏碎AI难关,走上阳关大道。

99743fe985abde1f9d4dcb13027a9a89.png

1.筋斗云,翻越模型天堑。

智算服务平台对行业智能化的赋能,首先需要提供完善、优质的大模型。天翼云在息壤一体化智算服务平台打造的大模型库,拥有国内领先的丰富大模型。其中包含Llama系列、Qwen系列、智谱系列、书生浦语系列等众多主流大模型,涵盖不同参数量级,供用户灵活选择。在原来29个模型的基础之上,本次新增上线重量级商业闭源大语言模型Baichuan4、主流开源大语言模型书生浦语2系列的InternLM2-Chat-7B和InternLM2-Chat-20B、图文多模态大模型Qwen-VL-Chat,以及Qwen2系列、Qwen1.5系列和Llama3系列的诸多模型。在这样的大模型阵容下,各行业可以轻松调用到符合自身需求的大模型,快速实现大模型到行业场景的孵化。

2.七十二变,化身数据万千。

在困扰行业大模型开发者的数据工作中,息壤一体化智算服务平台内置了专业的大模型数据集。中国电信在数据发展上开展的算数融合工程,首批推出超120万对文本和语义识别类通用大模型训练所必需的问答对数据,主要面向客服问答场景,解决了大量中小型企业训练数据不足的难题。

尤其需要注意的是,息壤一体化智算服务平台内置的数据集,在数据来源上经过了严格的审核,可以确保数据的准确性与真实性,并且通过多维度的数据验证,确保了数据集的完整性与一致性。行业大模型开发者可以获得高质量的数据支持,并且在该平台中直接将数据应用到训练、推理任务中。化身千万的数据集,就像齐天大圣的七十二变,可以带来堪称神奇的大模型训练效果。

3.金箍棒,打出最强训练。

面对开发者在大模型训练中的系列痛点, 天翼云在北京、上海建成两个万卡规模的公共智算中心,并在其资源池上搭载了息壤一体化智算服务平台,使其成为国内首个单集群万卡国产化全功能预训练云服务平台,可支持目前业内最大参数规模开源单体稠密模型Llama3 405B在内的大模型训练。训练测试结果显示,Llama3 405B模型集群有效计算效率MFU在国产化万卡规模情况下达到43%,达到业界领先水平。

9583733aa347aea030bf12d17e0180ce.png

息壤一体化智算服务平台具有全链路故障感知和恢复、全链路日志监控和断点续训等核心技术,能够实现1分钟检测、5分钟定位、1分钟内告警,本次平台升级还增加了网络I/O监控,为训练稳定性添加了保障。在断点续训方面,在Llama2-70b模型万卡规模测试场景下,在主机故障、NPU卡故障、进程退出故障、网络超时故障四大类具体场景下断点续训测试平均秒级故障检测,分钟级故障定位和自动化处理,分钟级训练恢复,其能力达到行业前沿水平。此次平台升级还新增了对芯片故障的优雅容错,能够做到无需重调度直接修复节点故障。目前,智算服务平台已经应用于大量用户的训推场景,如深圳市智算中心、人工智能实验室等。

4、火眼金睛,勘破场景应用。

面对不同行业、不同企业的多样化大模型应用场景,息壤一体化智算服务平台做了深度的洞察,就像点亮了“火眼金睛”,看到不同行业与企业对大模型的真实期待。

无论是具备深厚专业背景的行业客户,还是对大模型推训能力有严格要求的大模型厂商,都可以通过息壤一体化智算服务平台获得准确的支持,可通过直接调用预置的大模型服务,使得开发者能够轻松地将先进的AI技术集成到自己的业务中。

如今,AI取经之路上行者不绝,息壤一体化智算服务平台训推服务能力也为诸多“取经人”提供了深层次的帮助。

6984869f99708415f393e5194994904c.png

比如说,中医与大模型的结合,是近段时期的产业热点话题。中国中医科学院中医药信息研究所与天翼云合作,共同探索AI+中医药应用创新。在中医垂类大模型的微调、应用发布平台等环节中,天翼云提供的息壤一体化智算服务平台为中医药信息研究所提供了多样化的算法支持与模型优化工具,帮助大模型能够更好地挖掘中医药数据的潜在价值,实现中医瑰宝与AI技术的融合发展。

这些真实的大模型落地场景,证明了息壤一体化智算服务平台为行业智能化带来的有力推助。作为国家云的天翼云,正在通过智算服务踏碎AI难关,助力行业大模型开发顺利西行。

b41b8b373d7def913be0b93ac03a3af7.png

让每一位“AI取经人”都找到契合的产业助力,离不开围绕智算平台的生态建设。基于平台能力,天翼云联合伙伴上线了魔乐(Modelers.cn)开发者社区。

a211238d8010c20a6ae982b43c2b82eb.png

魔乐开发者社区真实贴合了中国的产业智能化环境,以及中国AI开发者的需求。就像《黑神话:悟空》展示的中国文化底蕴那样,天翼云承载国家云之责,不断加速构建满足AI产业发展所需的智算社区。具体而言,社区具有三大特色: 

1.极致易用的工具链。

魔乐开发者社区能够提供高易用性的API,快速实现开发者和研究人员的创意,并且支持千款大模型一键式离线复现,使能开发者快速搭建开发环境,构建AI应用。

2.中文优质AI资源。

魔乐开发者社区已经拥有超过1000个大模型,构建了5大专区,能够为开发者提供通义千问、chatGLM、百川、书生系列、星辰Telechat等主流中文大模型资源。

3.国产化算力使能。

面对国产化AI算力需求的发展,魔乐开发者社区还构建了体验空间,提供限时免费的国产化算力资源,支持MindSpeed、Accelerator等加速库,应对大模型时代分布式训练的挑战,显著提升大模型训练效率。

面向着数据、训练、推理的重重AI难关,天翼云选择步步前行,关关踏破。

经过不断的精进升级,天翼云智算服务平台已经在技术能力、资源积累、生态构建等方面展露出了极高的产业化水准。伴随各个领域的行业大模型开发者对智算服务平台的深度应用,产业智能化的路途正在变得愈发顺遂,前途更加光明。

踏智能路,选国家云。随着天翼云的息壤一体化智算服务平台训推服务能力的不断升级完善,会让每一位行业大模型开发者在AI世界中,都成为自己故事中的“取经人”。

8fc0e597b0b2eb922163bb3dfe5725ac.png

·

·

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2110313.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JVM系列(八) -运行期的几种优化技术

一、摘要 在之前的文章中我们谈到过,相比 C/C++ 语言,Java 语言在运行效率方面要稍逊一些,因为 Java 应用程序是在虚拟机上运行,而 C/C++ 程序是直接编译成平台相应的机器码来运行程序。 从虚拟机对外发布开始,开发团队一直在努力试图缩小 Java 与 C/C++ 语言在运行效率…

去除视频水印字幕从未如此简单!4款神器助你轻松搞定!

文章介绍的四款工具都已经打包好了,文末关注公众号AIshape 回复 “视频去水印” 获取 我们平时在各大视频网站下载的视频一般都会带有平台的logo水印,像Runway、Pika、即梦、可灵等AI视频生成平台创作的视频素材,非会员下载会带有水印 想利用这些视频素材进行二次创作很不方…

glsl着色器学习 (十二)平移

平移和旋转、缩放是一样的,替换成平移矩阵即可; // 创建一个单位矩阵 const translateYMatrix mat4.create();// 沿着Y轴向下平移1个单位 mat4.fromTranslation(translateYMatrix, [0, -1, 0]);// 设置矩阵 gl.uniformMatrix4fv(matrixUniformLocation…

Maven学习与使用

内容概要 Maven是什么,有什么作用会配置Maven的环境,以及在idea上配置(重点)掌握Maven的工程结构掌握Maven的几个重要指令。(clean compile package install)掌握如何导包及依赖冲突解决办法 1 Maven 1.…

超详细!!!最新的VuePress + Github Pages + Github Actions实现博客自动部署

超详细!!!VuePress Github Pages Github Actions实现博客自动部署 本文着重讲述如何使用通过Github Actions将VuePress项目部署自动在Github Pages上。每一位开发者有一个自己的博客网站是一件很酷的事情,由于最近想整理一下在…

SpringBoot学习(8)(Bean注册条件)(@Conditional的衍生注解)

目录 一、引言 二、案例引用(接着上篇博客) 三、注册条件 (1)ConditionalOnProperty (2)Conditional0nMissingBean (3)ConditionalOnclass 四、总结 一、引言 之前学习和了解了Bean对…

相亲交友系统商业开发

在快节奏的现代生活中,寻找真爱成为了许多人的渴望。相亲交友系统,作为连接心灵的桥梁,正逐渐成为人们寻找伴侣的首选方式。我们的团队h17711347205致力于开发一款创新的相亲交友系统,旨在通过智能化的匹配算法,为用户…

出门总是一身猫毛怎么办?霍尼韦尔、希喂、352、小米宠物空气净化器对比实测

毕业了好些年,前段时间有同学组织了聚会,聚一聚,我们班的专业本身就和动物有关,聊天自然而然聊到了宠物上去,有个同学打趣:“有没有养猫狗看看衣服就知道了”。还真是家里养了宠物的,无论咋清理…

电子商务小程序如何做seo

电子商务小程序进行SEO(搜索引擎优化)是一个综合性的过程,旨在提高小程序在搜索引擎中的排名,从而增加曝光度和用户流量。以下是一些关键的SEO策略和实践方法: 电子商务小程序如何做seo 1. 关键词研究与布局 关键词选…

第十七篇:TCP协议介绍(1)

1.TCP 的概念 传输控制协议(Transmission Control Protocol,TCP)是一种面向连接的、可靠的、基于字节流的传输层通信协议。在 TCP 协议中,通过三次握手建立连接。通信结束后,还需要断开连接。如果在发送数据包时&…

视频安防监控LntonAIServer安防管理平台抖动检测和过亮过暗检测

随着视频监控技术的发展,视频质量成为确保监控系统有效性的重要因素。LntonAIServer通过引入抖动检测与过亮过暗检测功能,进一步提升了视频监控系统的可靠性和用户体验。这些功能可以帮助及时发现并解决视频流中的质量问题,确保视频监控系统始…

数字广告监管者对高风险行业的打压,但是否应该...

不言而喻,如果你从事的是某些类型产品的推广业务,你需要格外小心。不懂我们的意思?那你算幸运了。我们指的是那些被归类为 高风险行业 的消费品或商业产品。 高风险行业是那些相较于其他行业“面临更多运营、监管和声誉风险”的行业。不完全列…

基于51单片机的倒计时装置proteus仿真

地址: https://pan.baidu.com/s/1p9xDKXaulyx-PyP6dURp-g 提取码:1234 仿真图: 芯片/模块的特点: AT89C52/AT89C51简介: AT89C52/AT89C51是一款经典的8位单片机,是意法半导体(STMicroelectro…

[SwiftUI 开发] 构建带有动画的图片瀑布流效果

在移动应用程序中,图片瀑布流布局是一种常见的设计模式,它不仅能够以网格的形式显示大量图片,还能允许用户点击图片进行全屏查看。 在下文中,将详细介绍如何使用 SwiftUI 构建一个带有点击动画效果的图片瀑布流布局,并…

B站视频下载教程

文章目录 1.确保浏览器下载了tampermonkey(油猴)2.下载插件3.下载mtorix4.浏览器刷新并下载视频 1.确保浏览器下载了tampermonkey(油猴) 至于这个步骤可以自行搜索一下很简单,讲油猴固定在状态栏,显示如下 2.下载插件 1.进入greasyFork 2.搜索B站视…

【Unity-Lua】音乐播放器循环滚动播放音乐名

前言:Unity中UI节点 图1 如上所示,一开始本来是打算用ScrollView做的,觉得直接计算对应的文本位置就行,所以没用ScrollRect来做,可以忽略Scroll,Viewport这些名字。如下图:需要在一个背景Image…

多级别分销平台怎么做 千店系统设计关键要点

创建多级别分销平台可以帮助企业拓展市场并激励分销商,多级别分销商城的良好设计可以助力企业的营销事半功倍。今天,商淘云为您分享千店系统设计的三大关键要点。 首先,选择合适的平台和技术工具至关重要。使用像商淘云供应链这样的电商平台&…

睿赛德科技携手先楫共创RISC-V生态|RT-Thread EtherCAT主从站方案大放异彩

日前,在先楫HPM6E00技术日上,睿赛德科技(RT-Thread)向广大工业用户展示了多年来双方在RISC-V生态领域的合作历程和成果,同时睿赛德科技携手先楫半导体首次推出了基于HPM6800处理器的EtherCAT主站解决方案,吸…

Uniapp + Vite + Vue3 + uView + Pinia 实现自定义底部 Tabbar(最新保姆级教程)

Uniapp Vite Vue3 uView Pinia 实现自定义底部 Tabbar(最新保姆级教程) 1、效果展示2、环境准备2.1 新建 uniapp 项目2.2. 安装 uView2.3 安装 pinia 3. 配置环境4. 创建目录结构5、编写 pages.json 页面路由6、编写 tabbar.js 状态数据7、编写 tabb…

Java-IDEA模拟一个Redis服务器,与Redis客户端进行一次简单的交互。默认端口号:6379

首先要了解Redis的交互协议。 摘抄: 简单字符串(Simple Strings): 以 “” 开头,例如 “OK\r\n” 表示一个成功的响应。错误(Errors): 以 “-” 开头,例如 “-ERR unknown command\r\n” 表示一…