NVMe over TCP高性能文件存储,让未来照进现实,400us

news2024/9/27 9:26:46

你真的懂NVMe吗?

在说NVMe之前,我们觉得有必要先聊一聊NVM(Non-Volatile Memory),即非易失性内存。从名字上看就知道,NVM是一种类内存式(访问及寻址方式类似)的设备,它必须具备高速读写数据的能力,但它和普通内存的区别在于Non-Volatile,即在关机后再打开电源也可以检索里边所存储的数据。这种非易失性内存NVM设备有很多种实现,我们常用于服务器的大容量NVM是一种闪存,即Flash Memory。闪存是一种固态芯片,主流的闪存设备使用NAND技术来映射数据,这种芯片无需任何外部电源即可维护存储的数据,它的读写速度比内存稍低,但无需借助机械方式进行寻址,因此读写性能远高于机械磁盘,容量也比内存要大,单GB成本近年来快速下降,大有成为服务器上高速存储介质主流设备的趋势。

NVMe协议组成架构

有了设备和协议就可以了吗?

有了NVM设备和访问这个设备的协议NVMe,就一定能享受到这些设备带来的高性能了吗?答案是否定的。

首先要说到的,就是数据传输的问题,数据传输指的就是NVM设备到服务器内存之间的传输。外围组件互连Express(PCIe)是目前使用最多的传输介质。NVM设备及NVMe协议设计之初,也是先面向PCIe或PCI Hub的。通过PCI访问NVM设备会有什么问题呢?很容易就能想到,一台服务器上PCI接口是有限的,因此也不能接入很多的NVM设备,那么容量就会受到限制了。此外,数据中心内其它服务器也很难通过PCI访问另一台服务器上的NVM设备。这就很大限制了NVM设备的使用。

除了PCI之外,还有什么方式能进行NVM设备上数据的传输吗?当然有,这就是NVMe over Fabric,所谓的Fabric有几种方式,可以是Fibre Chanel,即目前磁盘阵列中使用的传输网络,或者InfiniBand。NVMe-oF使得一台服务器可以通过网络的方式,通过NVMe协议直接访问远端另一台服务器上的NVM设备,带宽和延时近似于设备插在本地服务器上,这就极大拓宽了NVM设备的使用范围。但细心的读者应该很快能反应过来,在现代数据中心,TCP网络使用更广,因此,NVMe组织在2019年推出了NVMe over TCP技术,从而使服务器通过TCP网络就可以访问远端的NVM设备了。

NVMe over TCP技术作为创新型技术,从推出就瞄准了通过TCP互联的,更广阔的云和数据中心大规模使用NVM设备的场景。

其次是访问效率的问题,与SCSI等协议不同,NVMe协议实现了多队列的架构和指令集,更能发挥多核CPU服务器的处理能力,使该协议指令集在多核CPU服务器上发挥更好的性能,存储系统如果不能针对这些特点进行深入的优化,也不能充分享受到新型介质和协议带来的红利。而针对NVMe协议和设备进行的系统级优化,是包括焱融科技在内的软件定义存储厂商需要攻克的难关。

此外,还需要考虑应用访问接口的问题。目前,人工智能、高性能计算系统主要通过文件系统访问非结构化数据,构建以NVMe协议为基础的,以高带宽、低延时为核心要求的高性能文件系统是应用系统的核心要求,这也是应用场景驱动创新的出发点

YRCloudFile+LightOS 联合解决方案

LightOS是以色列技术型存储创新企业,焱融科技与Lightbits联合方案,可以为用户提供NVMe多队列并发访问的极致性能,最重要的是,能将NVMe设备通过TCP方式,组成高性能分布式文件系统,向上层应用提供文件访问服务。对上层应用而言,完全无需关心底层存储细节、数据如何放置,即可使用高IOPS、高带宽、极低延时的文件共享访问服务。

联合方案参考架构

焱融科技与Lightbits OS对参考架构进行了性能、可靠性、可用性的测试,测试架构如下所示:

各个服务器之间使用25Gb以太网进行连接,使用三台服务器搭建YRCloudFile集群,在常用的TCP网络条件下,单个客户端节点的4K随机读IOPS可达38万,写IOPS达30万,读写延时均低于400us。多客户端访问,各客户端性能互不干扰,集群可为每个客户端稳定提供相同的功能。

在大IO顺序读写测试中,单客户端读写带宽均达到2.8GB/s,接近25Gb网络带宽上限。

使用vdbench模拟200,000个不同文件大小进行读写带宽测试,对4K小文件的读写性能为1280MB/s和1040MB/s,对128KB大文件读写性能可达2800MB/s。

联合方案优势

YRCloudFile+LightOS联合方案,具备以下优势:

  • 只需借助现有的以太网络,即可快速搭建基于全NVMe的分布式文件系统,无需购买额外的专用交换设备和网卡
  • 多个上层应用服务器可通过文件接口共享访问底层海量非结构化数据
  • 业界一流的文件系统随机读写、顺序读写性能
  • 数据去重压缩,TCO减少20%-50%
  • 单集群可达百PB空间,承载百亿文件。满足海量的文件数量与空间需求
  • 可同时提供文件存储和块存储接口,满足不同业务接口的需求

High performance file system is critical infrastructure facility to applications like AI. YanRong Tech and Lightbits Lab cooperate closely, announce the NVMe/TCP file system with high performance and massive small files support, providing an innovative solution to all customers and partners. ------ Alfred Chase Hui, Lightbits亚太区销售总监

该联合方案非常适用于人工智能、高性能计算、基因科学、影视渲染、气象分析、资源勘探等依赖高性能文件系统,以及拥有海量非结构化数据的应用场景,能有效帮助客户提升业务系统对非结构化数据的访问性能,从而改进业务运行效率,解决数据分析的系统瓶颈。

如需获取解决方案完整版本,查看推荐架构以及参考性能指标,请发送邮件联系我们:sales@yanrongyun.com。

Lightbits Labs

成立于2016年的Lightbits Labs正在全球范围内重塑现代云基础设施。公司的使命是重构存储和网络在云数据中心的部署方式。Lightbits的软件定义分离式存储解决方案为企业私有云、软件即服务(SaaS)和基础架构即服务(IaaS)提供商节省大量时间和成本,同时实现更高的应用程序性能和公共云级别的可扩展性。Lightbits Labs最先认识到全NVMe高性能存储介质及协议与标准TCP网络相结合所带来的机会。其LightOS®软件和LightField™存储加速卡是第一个提供在标准TCP网络上运行的全局闪存转换层(GFTL)的NVMe/TCP解决方案。

焱融科技

焱融科技是一家以软件定义存储技术为核心竞争力的高新技术企业,在分布式存储等关键技术上拥有自主知识产权,是高性能文件存储和容器存储的领导者。焱融科技核心产品YRCloudFile在全球IO500性能测试中,进入世界前六。同时,YRCloudFile是国内首个进入CNCF Landscape的容器存储产品。焱融科技针对各行业业务特性,打造个性化行业解决方案,提供一站式的产品与服务。焱融科技系列产品已服务于人工智能、金融、政府、制造业、互联网等行业的众多客户。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1379897.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小鼠的滚动疲劳仪-转棒实验|ZL-200C小鼠转棒疲劳仪

转棒实验|ZL-200C小鼠转棒疲劳仪用于检测啮齿类动物的运动功能。通过测量动物在滚筒上行走的持续时间,来评定**神经系统*病或损坏以及药物对运动协调功能和疲劳的影响。 疲劳实验中,让小鼠在不停转动的棒上运动,肌肉会很快进入疲劳状态&#…

办理美国FCC认证的意义是什么?

首先是法律法规的要求; 其次,客户认可,声誉; 最后,办理美国FCC认证的意义主要体现在以下几个方面: 保障公共利益:FCC认证要求产品符合美国联邦通信委员会制定的规定,防止不符合标准…

深度学习烦人的基础知识(2)---Nvidia-smi功率低,util高---nvidia_smi参数详解

文章目录 问题现象解释解决方案 磨刀不误砍柴工--nvidia-smi参数解读 问题 如下图所示,GPU功率很低,Util占用率高。这个训练时不正常的! 现象解释 Pwr是指GPU运行时耗电情况,如图中GPU满载是300W,目前是86W与GPU2的…

为什么不直接public,多此一举用get、set,一文给你说明白

文章目录 1. 封装性(Encapsulation)2. 验证与逻辑处理3. 计算属性(Computed Properties)4. **跟踪变化(Change Tracking)5. 懒加载与延迟初始化(Lazy Initialization)6. 兼容性与未来…

面试算法117:相似的字符串

题目 如果交换字符串X中的两个字符就能得到字符串Y,那么两个字符串X和Y相似。例如,字符串"tars"和"rats"相似(交换下标为0和2的两个字符)、字符串"rats"和"arts"相似(交换下…

服务器管理平台开发(3)- Web后端

Web服务端 整体架构采用前后端分离形式,后端使用Golang实现,参考Gin框架 1、后端服务 1.1、服务端架构 代码可参考Github开源项目:https://github.com/pbrong/hrms 1.2、服务地址 http://x.x.x.x:8000/api/v1/meta/info http://x.x.x.x:800…

72、C++ 代码格式规范的一个工具使用:clang-format

本节与小册内容无关,仅仅是介绍一个C++代码格式规范化的工具,用来将写的杂乱无章,格式不规范的C++代码来统一调整为规范的格式,包括空格、对齐等,使得C++代码美观大方。 因为 C++ 仓库中用到了这个工具,所以介绍下,有平时用C++做开发的同学也可以使用一下。 clang-for…

算法回忆录——排序

文章目录 1. 插入排序2. 选择排序3. 冒泡排序4. 希尔排序5. 归并排序6. 快速排序7. 堆排序8. 计数排序9. 桶排序10. 基数排序 1. 插入排序 分为两个序列,前面一个序列是排好序的,后面一个序列是未排好的。未排好的序列的第一个元素(a&#x…

独立客服系统的消息通知推送

消息通知 当我们在自己网站上嵌入对接了客服代码,我们想要通过微信接收访客的消息提醒通知,可以通过扫描客服后台的微信二维码,即时收消息通知提醒。 客服后台 后台主页面板,就展示了一个微信二维码,扫码关注公众号…

【大数据】Flink 详解(八):SQL 篇 Ⅰ

本系列包含: 【大数据】Flink 详解(一):基础篇【大数据】Flink 详解(二):核心篇 Ⅰ【大数据】Flink 详解(三):核心篇 Ⅱ【大数据】Flink 详解(四…

太阳光模拟器在晶圆硅片均匀加热解决方案

概述 晶圆硅片是半导体行业中使用的一种重要材料。它是由单晶硅经过一系列工艺加工而成的薄型圆片。晶圆在半导体制造过程中起到了基础性的作用,是制作晶体管和集成电路的关键原材料。硅片是一种重要的半导体材料,被广泛应用于电路制造、太阳能电池板等…

kafka: 基础概念回顾(生产者客户端和机架感知相关内容)

一、kafka生产者客户端 在kafka体系结构中有如下几个重要的概念: Producer:生产者,负责生产消息并投递到kafka broker的某个的分区中Consumer:消费者,负责消费kafka若干个分区中的消息Broker:kafka服务节…

微软为Windows内置记事本应用开发AI功能;2024年15个 AI 语音生成器

🦉 AI新闻 🚀 微软为Windows内置记事本应用开发AI功能 摘要:微软正在开发一个新的生成式AI功能,名为"Cowriter",用于Windows内置的记事本应用。该功能类似于画图应用中的"Cocreator"功能&#x…

计算机导论04-操作系统

操作系统基础 操作系统及其特征 操作系统的概念 操作系统是: 管理和控制计算机硬件与软件资源的计算机程序的集合;操作系统直接运行在“裸机”之上,是最基本的系统软件,其他软件都必须在操作系统的支持下才能运行。 操作系统…

vue中使用js-doc

安装依赖 安装vue-template-compiler npm install ​vue-template-compiler​npm install ​vue-template-compiler​ 安装minami npm install minami 安装js-doc npm install js-doc 根目录下创建 .jsdoc.conf.json 内容: {"tags": {"all…

VMware Visio OmniGraffle模板和图标

VMware Visio OmniGraffle模板和图标 包含可用于Visio、omnigraffle的图标和SVG矢量图。 简介 这组资源适用于 IT 管理员、系统架构师、网络工程师和其他需要可视化 VMware 基础架构的专业人士创建精确的 VMware 网络和数据中心部署图,通过使用这些模板和图标&am…

国内开源环境漫谈

我国开源软件产业相较于欧美发达国家而言起步相对较晚,开源项目很少超过五年,开发者较年轻。国外很多开源项目都是10年以上的规划与投入。在开源社区发展初期、发展期、协作期、结晶期与流行期的五个阶段中,中国的开源社区平台大多处于前三个…

RabbitMQ解决消息丢失以及重复消费问题

文章目录 1、概念2、基于ACK/NACK机制2.1 基于Spring AMQP框架整合ACK/NACK机制2.2 测试消费失败1.02.3 测试结果1.02.4 测试MQ宕机2.5 测试结果2.0 3、RabbitMQ 如何实现幂等性设计3.1 幂等服务设计思路3.1.1 通过雪花算法生成分布式唯一ID3.1.2 通过枚举类,设计Me…

亚马逊怎么防止店铺关联?

亚马逊(Amazon)为了确保公平竞争和防止不当行为,采取了一些措施来防止店铺关联,即通过不同的方式将多个店铺相关联,以获取不正当的竞争优势。以下是一些亚马逊防止店铺关联的主要措施: 同一经营者规定&…

【TC3xx芯片】TC3xx芯片电源管理系统PMS详解

目录 前言 正文 1.供电模式选择(Supply Mode Selection) 1.1 供电域 1.2 供电模式 1.3 供电阈值 1.4 供电上升和下降行为Supply Ramp-up and Ramp-down Behavior 1.5 EVRC产生供电 2. 电源监控 2.1 电源监控原理 2.2 Primary低电压监控 2.3 …