大模型时代,如何以 SDS 助力 AI 发展?

news2024/9/25 5:24:12

本文根据 XSKY星辰天合产品总监赵琳在 2023 闪存峰会上的演讲。该峰会主题为“芯存储 AI 未来”,由 DOIT 传媒主办、杭州华澜微电子股份有限公司协办,于 8 月 29-30 日在杭州召开。

7562589e9f69de48c09cbfdb8a6a02cc.jpeg星辰天合产品总监赵琳在 2023 闪存峰会上发表演讲


人工智能已经从经典 AI 发展到大模型阶段,并且还在急速演进中。根据相关数据统计,在此前 18 个月内大模型的参数的增量达到了 35 倍以上,其参数在指数性地上升,其所分析的相关数据以及过程数据也会呈现较大的增长量

b990fea945f235ac61152bf6be607510.jpeg

人工智能处理所需的数据量急剧增长


而就在这两天,OpenAI 也最新推出了针对企业级用户的企业版 ChatGPT,可以允许客户上传自己公司数据,训练和定制化企业内部使用的专属 GPT,这必将导致相关数据量的再次大规模增长。

在 GPT-4 引入图片分析之后,数据量已经达到了 PB 级别。在这样的情况下,必然会对人工智能系统后端的存储,包括其稳定性、整体的兼容性,乃至性能,都提出了诸多要求



AI 各环节

对数据存储的需求



针对 AI 整个模型分析的环节,可以做一个细粒度的拆分,并据此规划整个存储系统的要求和需求。

d294cffd7acc0e328e56f4492e8754f0.jpeg

AI 各环节对存储系统的需求


在采集和处理阶段,因为要将数据进行采集和导入到系统中,并且进行数据清洗、转换、标注等操作,所以它就会对存储系统能够支持多种协议以及扩展性有比较大的要求

因为数据来源多元,不可能只通过一种协议接口来实现数据的导入,很可能是多种渠道,通过包括 FTP、NFS 等在内的多种方式实现数据的汇聚。因此,存储系统在支持多种协议之外,还需要数据能够在不同协议之间进行相应的转换和流动

在模型开发阶段,由于人工智能运算的很大一部分操作是对于源数据的查询,因此需要存储系统能够具备强大的数据检索能力,并确保权限管控得当等

模型训练阶段,就需要系统能够快速地实现数据集的读取,加速整个 AI 模型训练的完成,这也是目前而言存储系统需要体现的最核心的价值点,需要有足够优良的读取、写入性能,以及近计算缓存性能

在模型推理阶段,人工智能系统需要解决数据分发以及传输的问题,需要存储系统具备高性能传输,以及具备高扩展性

整体而言,大模型阶段人工智能对存储系统的需求就是:扩展性和稳定性、高性能、数据管理以及成本优化



基于 SDS

构筑一站式AI存储方案



星辰天合针对现阶段人工智能对存储系统的需求,基于在软件定义存储领域长期的研发优势和产品能力,构筑了一站式的存储方案

129f509981bc427e47af876231df9265.jpeg

星辰天合的 AI 一体化存储解决方案


首先,星辰天合的对象存储 XEOS,它可以为数据的汇聚、处理、消费等提供支撑

在 AI 系统进行分析时,星辰天合的高性能文件存储 XGFS 作为其存储支撑;当数据分析完成,无论是过程数据还是结果数据,均可以再次由对象存储服务平台来存储数据; 

XOCP 数据管理平台则可以帮助 AI 系统实现数据的管理与调度,满足数据在不同的协议和存储系统之间的流动需求

举例而言就是,在初始阶段,数据都汇存于底层的对象存储中,在 AI 系统要进行模型分析时,由 XOCP 来完成相应的数据查询及抽取操作,并且将抽取出来的数据导入高性能文件存储中,进行相关的数据分析操作;在数据分析完成之后,依然是由 XOCP 将相关的数据存到底层的对象存储构筑的数据湖之中。

基于该架构,可以最大化的利用所有存储资源,发挥各种存储系统的优势,实现最优的性价比。而星辰天合也即将发布全闪存储,整合到存储方案中之后,将能够以更优异的性能保证 AI 业务的发展,满足 AI 对存储系统日益上涨的性能需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/958077.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

aac音频格式怎么转mp3?这种转换方法很简单

AAC格式和MP3格式都是数字音频格式,但它们使用不同的音频压缩算法。虽然AAC格式在音质和文件大小方面表现出色,但是不是所有的设备都支持该格式。相比之下,MP3格式的兼容性更好,可以在各种设备和操作系统上播放,因此转…

深入浅出:手把手教你实现单链表

一、什么是链表 链表是一种链状数据结构。简单来说,要存储的数据在内存中分别独立存放,它们之间通过某种方式相互关联。 如果我们使用C语言来实现链表,需要声明一个结构体作为链表的结点,结点之间使用指针关联。 二、单向链表的结…

软件测试(黑盒测试、白盒测试、灰盒测试)

软件测试方法大类上分为黑盒测试、白盒测试和灰盒测试三种 一、黑盒测试 黑盒测试通俗来说即不知道代码是怎么写的。具体实现逻辑,基于代码输入有哪些应该输出什么进行测试的方法。其方法有:基于直觉和经验的方法(IEBT)、基于需…

b站手机缓存文件转MP4

b站缓存的文件 音频、视频、弹幕是分开的 这里我只用到了音频和视频所以只介绍这一部分 b站的缓存视频文件和路径结构如下 默认缓存路径 内部存储\Android\data\tv.danmaku.bilil\download\89720189 文件夹结构 文件夹 c_738583 这是单个视频的缓存文件夹 进入c_738583文件夹…

isEmpty 和 isBlank 的区别

干了3年java,代码中 isEmpty 和 isBlank 的区别 都不知道,一顿瞎用。也许你两个都不知道,也许你除了isEmpty/isNotEmpty/isNotBlank/isBlank外,并不知道还有isAnyEmpty/isNoneEmpty/isAnyBlank/isNoneBlank的存在, come on ,让我们…

【黑马头条之项目部署_持续集成Jenkins】

本笔记内容为黑马头条项目的项目部署_持续集成部分 目录 一、内容介绍 1、什么是持续集成 2、持续集成的好处 3、今日内容 二、软件开发模式 1、软件开发生命周期 2、软件开发瀑布模型 3、软件的敏捷开发 三、Jenkins安装配置 1、Jenkins介绍 2、Jenkins环境搭建 …

XP-CLR分析学习笔记

XP-CLR分析笔记 生物信息学和遗传学是相互交织的两个学科,共同致力于解读生物体内复杂的基因信息。这些信息有助于理解物种的演化,疾病的起因,以及个体差异等方面。 XP-CLR(Cross Population Composite Likelihood Ratio&#xff…

《Linux从练气到飞升》No.19 进程等待

🕺作者: 主页 我的专栏C语言从0到1探秘C数据结构从0到1探秘Linux菜鸟刷题集 😘欢迎关注:👍点赞🙌收藏✍️留言 🏇码字不易,你的👍点赞🙌收藏❤️关注对我真的…

【python爬虫】6.爬虫实操(带参数请求数据)

文章目录 前言项目:狂热粉丝分析过程什么是带参数请求数据如何带参数请求数据 代码实现被隐藏的歌曲清单什么是Request Headers如何添加Request Headers 复习 前言 先来复习一下上一关的主要知识吧,先热个身。 Network能够记录浏览器的所有请求。我们最…

钡铼技术BL120PN Profinet和Profibus DP转Modbus网关介绍

​ 编辑切换为居中 添加图片注释,不超过 140 字(可选) BL120PN是一款Profinet、Profibus D转Modbus网关。 BL120PN下行采集支持:Profinet、Profibus D。 BL120PN上行支持:Modbus RTU、Modbus TCP协议。 BL120PN采…

实现微信H5的方法!(非官方产品)

实现微信H5的方法!(非官方产品) WAP支付也叫H5支付,均指的是手机页面支付, 微信称之为H5支付,支付宝则称为WAP支付。 那H5也叫WAP支付是可以应用手机页面支付和APP支付的, 不限制包名可跨平台调…

元素周期表-背诵元素周期表更简单

元素周期表是一款极其炫酷、简约的记忆和查看周期表元素的软件。 【软件特点】: ●有趣谐音速记:软 件内有按周期、化合价、元素符号分类使用谐音速记的小技巧。 ●3D元素周期表:用户可以选择按表面、球体、螺旋、网格来3D炫酷的展示元素周期…

【技术】视频云存储/安防监控视频/智能分析网关V3裸土未覆盖/苫盖算法详解

随着经济的发展和建筑工地的增多,对于土堆的裸露情况实时监测和管理变得尤为重要。为了解决这一问题,TSINGSEEE青犀AI智能分析网关V3的裸土未苫盖算法就能很好地解决。 AI算法模型可以实时识别路面/建筑工地中的土堆是否裸露,将工地、道路等…

煤矿监管电子封条算法

煤矿监管电子封条算法基于yolov5网络模型深度学习框架,先进技术的创新举措,煤矿监管电子封条算法通过在现场运料运人井口、回风井口、车辆出入口等关键位置进行人员进出、人数变化和设备开停等情况的识别和分析。YOLO检测速度非常快。标准版本的YOLO可以…

特斯拉新款Model3曝光:搭载HW3.5硬件,雷达已移除,今日上市?

根据最新的消息,特斯拉新款 Model 3 将有一些令人瞩目的变化和改进。首先,前脸的设计仍然采用封闭式造型,但新车的前保险杠进行了微调,并且换装了全新款式的大灯。 这些改变使新款 Model 3 在外观上与现款车型有了明显的差异&…

【数据结构回顾】

数据结构回顾 一、单链表二、单循环链表 一、单链表 #include <stdio.h> #include <stdlib.h>typedef struct Node {int data;Node *next; }Node;Node* initList() {Node *list (Node*)malloc(sizeof(Node));list->data 0;list->next NULL;return list; }…

基于pytorch LSTM 的股票预测

学习记录于《PyTorch深度学习项目实战100例》 https://weibaohang.blog.csdn.net/article/details/127365867?ydrefereraHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQ3MjU2MTYyL2NhdGVnb3J5XzEyMDM2MTg5Lmh0bWw%2Fc3BtPTEwMDEuMjAxNC4zMDAxLjU0ODI%3D 1.tushare Tushare是一个免费、…

C++项目:网络版本在线五子棋对战

目录 1.项目介绍 2.开发环境 3.核心技术 4. 环境搭建 5.websocketpp 5.1原理解析 5.2报文格式 5.3websocketpp常用接口介绍 5.4websocket服务器 6.JsonCpp使用 6.1Json数据格式 6.2JsonCpp介绍 7.MySQL API 7.1MySQL API介绍 7.2MySQL API使用 7.3实现增删改查…

lnmp架构-mysql2

4.mysql 组复制集群 首先对所有的节点重新初始化 因为对节点的数据一致性要求非常高 主从复制的时候 slave只会复制master的binlog日志 就是二进制日志 不会复制relay_log 在server1上 根据实际情况修改主机名和网段 log_slave_updateON 意思就是 当slave的sql线程做完之后…

深度学习基础篇 第一章:卷积

dummy老弟这几天在复习啊我也跟着他重新复习一轮。 这次打算学的细一点&#xff0c;虽然对工作没什么帮助&#xff0c;但是理论知识也能更扎实吧&#xff01; 从0开始的深度学习大冒险。 参考教程&#xff1a; https://www.zhihu.com/question/22298352 https://zhuanlan.zhih…