磁带存储:“不老的传说”依然在继续

news2024/9/21 22:56:49

现在是一个数据指数增长的时代,根据IDC数据预测,2025年全世界将产生175ZB的数据。

图片

这里面大部分数据是不需要存储的,在2025预计每年需要存储11ZB的数据。换算个容易理解的说法,1ZB是10^18Bytes, 相当于要写5556万块容量18TB的硬盘。

图片

这些存储的数据中,仅10%认为是Hot频繁访问的数据,90%的数据都将是Warm/Cold温冷数据, 也就是不经常访问的数据。举个简单的例子,我们目前每人至少1部智能手机,里面存储大量的照片、视频、聊天记录等个人隐私数据,这些数据自产生后,我们开始可能会经常访问,在3个月以后,你还会对着数据有访问的诉求吗?这个概率基本会下降到1%以下。

图片

从概率统计学来讲,超过3个月(90天)不再访问的数据,我们都可以称为冷数据,归档数据。每年全世界有25-35%的新增归档冷数据需要存储。这个市场的需求是非常的庞大。

图片

目前归档冷数据的最终归属大多数是基于HDD,SMR,磁带Tape等介质的冷存储系统。冷存储系统的最大的优点就是成本低和数据保留时间长,但是也带来相应的缺点就是冷归档数据读取过程需要“解冻”,数据访问响应时间拉长。

图片

从上图存储介质的出货量和类型数据,我们也可以看到,在2025年,机械硬盘包括SMR新型机械盘存储介质的占比仍然有50%。从20世纪30年代开始算的话,磁带技术也算是一位接近期颐百岁老人了,磁带技术虽然古老,但凭借独特的魅力依然挑起了世界数据存储的重担。

图片

根据最新的年度LTO(Linear Tape-Open,线性磁带开放标准)项目介质出货量报告,2023年磁带存储的出货容量达到了惊人的152.9EB(压缩后),相比2022年增长了3.14%,这一增长部分归因于“数据生成的快速增长以及超大规模运算和企业对基础设施需求的提升”,特别是人工智能领域的存储需求激增。

图片

LTO技术背后的三大合作伙伴——HPE、IBM和Quantum联合发布的这份报告揭示了磁带存储生命力顽强的一面。在过去的十二年里,尽管固态硬盘(SSD)和传统硬盘驱动器(HDD)等新存储技术不断涌现并逐渐成为主流,磁带存储非但没有消亡,反而在特定领域持续发挥其独特优势。

磁带存储之所以能保持一席之地,原因有三:

  1. 巨大容量与离线便捷:磁带提供了庞大的存储空间,并且易于脱机保存,这对于长期存档和不频繁访问的数据而言非常合适。

  2. 耐用性和长期安全性:磁带介质被证实可以安全地保存数据长达30年,对于长期数据保护和避免如勒索软件攻击的风险尤为重要。

  3. 成本效益与环境友好:在成本方面,尤其是对于备份和档案存储,磁带经常比硬盘更经济,同时其环境影响也小于HDD和SSD,符合绿色存储的趋势。

然而,磁带存储的主要局限在于数据访问速度慢,恢复过程可能较为耗时,这使得它更适合用于冷数据存储,即那些不经常访问的信息。

扩展阅读:

  • 告别emo|HDD&磁带:我的春天来了

  • LTO助推磁带大容量存储技术超越磁盘HDD

  • 为LTO磁带而生的文件系统LTFS|主线任务—夺回"秋雅"

  • LTO磁带 PK 磁盘HDD:谁会让数据中心变"绿"?

  • 大容量疯了!居然想把磁带放到硬盘,100TB+是否可以实现?

对比硬盘的出货容量,磁带虽然在总量上显示出增长,但两者在市场定位和应用场景上存在显著差异。例如,仅希捷一家硬盘制造商在2024年第三季度就出货了99EB的硬盘,显示出硬盘在活跃数据存储市场的主导地位。因此,磁带和硬盘各有千秋,分别服务于不同的存储需求和场景,共同支撑起现代数据存储的广阔天地。磁带的“不死传说”证明了,在技术快速迭代的今天,每一种存储解决方案都有其不可替代的价值和存在的理由。

扩展阅读:

  • 深度剖析:大容量QLC SSD为何遭疯抢?

  • SSD与HDD仍然共存,并将长期共存!

此前,Spectra Logic 和 Geyser Data 联手推出了一项名为 TAPAS(Tape Archive Platform As-a-Service)的创新服务,标志着业界首次将磁带存储以服务的形式提供给用户。这项基于订阅的服务允许即时配置、按需扩展,并且使用过程中无需专业的知识或技能,为用户提供了简便、经济的磁带存储解决方案。

图片

TAPAS 服务的核心特点:

  1. 即时且可扩展:TAPAS 提供的磁带存储基于订阅模式,用户可以根据需求即时获取服务并进行扩展,无需前期大量投入或专业知识。

  2. 成本效益:与典型的云冷存储服务相比,TAPAS 承诺提供更经济的解决方案,通过结合 Spectra Logic 的成熟磁带技术与 Geyser Data 的现代化服务交付模型,降低了长期存储成本。相比 AWS S3 归档,TAPAS 数据检索更快且无访问或提取费用,甚至可选服务将磁带快递至用户。

  3. 高性能与安全性:结合 Spectra Logic 的 Cube 图书馆系统、LTO-9 磁带媒体以及 BlackPearl S3 对象存储,TAPAS 提供了一个与 AWS S3 和 Glacier 兼容的系统,确保数据安全且易于访问。

  4. 灵活的数据管理:Geyser Data 的 TaaS 软件负责服务的配置、管理、监控、计费和实例化,简化了用户端的操作流程。

  5. 数据控制与隔离:Geyser Data 保证每个磁带只存储一个客户的资料,并允许客户掌控加密密钥,增强数据安全性和隔离性,减少网络威胁风险。

  6. 环保与合规:利用磁带存储的环保特性,TAPAS 同时解决了数据驻留、本地化或主权问题,让用户能够指定数据的实际地理位置。

还有富士Fujifilm,作为磁带存储介质的生产商和倡导者,最近推出了面向档案存储的Kangaroo融合系统,并即将发布一款针对中小企业的“Lite”版本

图片

Kangaroo系统简介:

  • 原始版本:包含120盘LTO磁带,采用带有轮子的箱体设计,配备集成鼠标和屏幕、不间断电源(UPS)及公司的对象存档软件。该单元可存储高达1PB的数据,标价最高达€350,000(约$375,000)。

  • Lite版本:为中小企业提供存储容量上限为100TB的解决方案,价格低于€100,000(约$107,000),旨在降低准入门槛,使更多企业能够利用磁带存储技术。

富士欧洲执行副总裁Peter Struik在罗马举办的IT Press Tour上透露,轻量级的Kangaroo Lite预计将于当年7月或8月面市。他提到,欧洲的一些大型机构已经测试并采用了标准版Kangaroo系统,包括卢森堡银行、一家健康机构和荷兰的一所大学。此外,还有两台设备正在运往英国,用于商业市场的试用推广。

相比硬盘存储,磁带存储能减少95%的碳排放。考虑到硬盘通常需要持续供电以保持数据随时可访问,而Kangaroo系统设计主要为离线使用,这一环保优势更为显著。公司还指出,企业数据中有70%属于“冷数据”,并不立即用于业务运营,但仅有5%的冷数据被存储在如磁带这类成本效益更高的系统上,表明磁带存储在节能减碳方面具有巨大潜力。

参考文献

1.https://www.tomshardware.com/pc-components/storage/tape-shipments-increased-to-1529-exabytes-in-2023-pretty-lively-for-a-dead-storage-medium

2.https://blocksandfiles.com/2024/05/15/spectra-logic-geyser-tape-as-a-service/

3.https://blocksandfiles.com/2024/04/12/fujifilm-kangaroo-lite/


如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

  • 浅析3D NAND多层架构的可靠性问题

  • SSD模拟器MQSim简介与资料分享

  • 孙凝晖院士万字长文|人工智能与智能计算的发展

  • 探究NVMe SSD HMB应用场景与影响

  • 深度剖析:大容量QLC SSD为何遭疯抢?

  • SSD突然掉电,是谁保护了用户数据?

  • 漫谈HAMR硬盘的可靠性

  • 万物皆可计算|下一个风口:近内存计算

  • SSD数据错误如何修复?

  • CXL与PCIe世界的尽头|你相信光吗?

  • 全景剖析SSD SLC Cache缓存设计原理

  • 存储革新:下一代低功耗PCM相变存储器

  • 3D DRAM虽困难重重,最快明年到来

  • 字节跳动入局存储内存SCM

  • PCIe 7.0|不要太卷,劝你先躺平

  • SSD LDPC软错误探测方案解读

  • 关于SSD LDPC纠错能力的基础探究

  • 存储系统如何规避数据静默错误?

  • PCIe P2P DMA全景解读

  • 深度解读NVMe计算存储协议

  • 对于超低延迟SSD,IO调度器已经过时了吗?

  • 浅析CXL P2P DMA加速数据传输的原理

  • HDD回暖于2024,与SSD决战于2028

  • FIO测试参数与linux内核IO栈的关联分析

  • NVMe over CXL技术如何加速Host与SSD数据传输?

  • 浅析LDPC软解码对SSD延迟的影响

  • 为什么QLC NAND才是ZNS SSD最大的赢家?

  • SSD在AI发展中的关键作用:从高速缓存到数据湖

  • 浅析不同NAND架构的差异与影响

  • SSD基础架构与NAND IO并发问题探讨

  • 字节跳动ZNS SSD应用案例解析

  • CXL崛起:2024启航,2025年开启新时代

  • NVMe SSD:ZNS与FDP对决,你选谁?

  • 浅析PCI配置空间

  • 浅析PCIe系统性能

  • 存储随笔《NVMe专题》大合集及PDF版正式发布!

如果您也想针对存储行业分享自己的想法和经验,诚挚欢迎您的大作。
投稿邮箱:Memory_logger@163.com (投稿就有惊喜哦~)

《存储随笔》自媒体矩阵

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1714959.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

markdown语法保存

这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

PaddleOCR2.7+Qt5

章节一:Windows 下的 PIP 安装 官网安装教程地址 按照里面的教程去安装 如果使用cuda版本的还要安装tensorrt,不然后面运行demo程序的程序会报如下错。 下载TensorRT 8版本,tensorrt下载地址 章节二:编译源码 进入官网源码地址 下…

深入解析Web前端三大主流框架:Angular、React和Vue

Web前端三大主流框架分别是Angular、React和Vue。下面我将为您详细介绍这三大框架的特点和使用指南。 Angular 核心概念: 组件(Components): 组件是Angular应用的构建块,每个组件由一个带有装饰器的类、一个HTML模板、一个CSS样式表组成。组件通过输入(@Input)和输出(…

旧手机翻身成为办公利器——PalmDock的介绍也使用

旧手机有吧!!! 破电脑有吧!!! 那恭喜你,这篇文章可能对你有点用了。 介绍 这是一个旧手机废物利用变成工作利器的软件。可以在 Android 手机上快捷打开 windows 上的文件夹、文件、程序、命…

解决文件传输难题:如何绕过Gitee的100MB上传限制

引言 在版本控制和代码托管领域,Gitee作为一个流行的平台,为用户提供了便捷的服务。然而,其对单个文件大小设定的100MB限制有时会造成一些不便。 使用云存储服务 推荐理由: 便捷性:多数云存储服务如: Dro…

构造+模拟,CF1148C. Crazy Diamond

一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 Problem - 1148C - Codeforces 二、解题报告 1、思路分析 题目提示O(5n)的解法了,事实上我们O(3n)就能解决,关键在于1,n的处理 我们读入数据a[],代表初始数组…

(函数)求一元二次方程的根(C语言)

一、运行结果&#xff1b; 二、源代码&#xff1b; # define _CRT_SECURE_NO_WARNINGS # include <stdio.h> # include <math.h>//声明函数&#xff1b; //判断条件等于0时&#xff1b; void zeor(double a, double b);//判断条件大于0时&#xff1b; void bigzeo…

【Linux】Socket中的心跳机制(心跳包)

Socket中的心跳机制(心跳包) 1. 什么是心跳机制&#xff1f;(心跳包) 在客户端和服务端长时间没有相互发送数据的情况下&#xff0c;我们需要一种机制来判断连接是否依然存在。直接发送任何数据包可以实现这一点&#xff0c;但为了效率和简洁&#xff0c;通常发送一个空包&am…

java高级——Collection集合之List探索(包含ArrayList、LinkedList、Vector底层实现及区别,非常详细哦)

java高级——Collection集合之List探索 前情提要文章介绍提前了解的知识点1. 数组2. 单向链表3. 双向链表4. 为什么单向链表使用的较多5. 线程安全和线程不安全的概念 ArrayList介绍1. 继承结构解析1.1 三个标志性接口1.2 AbstractList和AbstractCollection 2. ArrayList底层代…

⌈ 传知代码 ⌋ YOLOv9最新最全代码复现

&#x1f49b;前情提要&#x1f49b; 本文是传知代码平台中的相关前沿知识与技术的分享~ 接下来我们即将进入一个全新的空间&#xff0c;对技术有一个全新的视角~ 本文所涉及所有资源均在传知代码平台可获取 以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦&#x…

洗地机什么品牌质量好?家用洗地机排行榜

一年一度的大促节又到了&#xff0c;各大电商平台和实体店纷纷推出力度不小的折扣活动&#xff0c;吸引着消费者的关注和购买欲望。很多家庭也趁着这个机会&#xff0c;购置一些智能家居产品来提升生活品质。其中&#xff0c;洗地机作为近年来发展迅速的明星产品&#xff0c;受…

【UML用户指南】-02-UML的14种图

1、结构图 1、类图&#xff08;class diagram&#xff09; 展现了一组类、接口、协作和它们之间的关系。 在面向对象系统的建模中所建立的最常见的图就是类图。类图给出系统的静态设计视图。 包含主动类的类图给出系统的静态进程视图。构件图是类图的变体。 2、对象图&a…

什么是 ISP 代理?

代理是路由互联网流量的中间服务器&#xff0c;通常分为三类&#xff1a;数据中心、住宅和 ISP。根据定义&#xff0c;ISP 代理隶属于互联网服务提供商&#xff0c;但实际上&#xff0c;更容易将它们视为数据中心和住宅代理的组合。 让我们仔细研究一下 ISP 代理&#xff0c;看…

计算机网络学习笔记——应用层

一、应用层概述 二、客户/服务器方式(C/S方式)和对等方式(P2P方式) 客户/服务器(Client/Server&#xff0c;C/S)方式 服务器总是处于运行状态&#xff0c;并等待客户的服务请求。服务器具有固定端口号(例如HTTP服务器的默认端口号为80)&#xff0c;而运行服务器的主机也具有固…

Vue.js2+Cesium1.103.0 十六、多模型轨迹运动

Vue.js2Cesium1.103.0 十六、多模型轨迹运动 Demo <template><div id"cesium-container" style"width: 100%; height: 100%;"><ul class"ul"><li v-for"(item, index) of deviceInfo" :key"index" cl…

E. Binary Deque[双指针好思维题]

Binary Deque 题面翻译 有多组数据。 每组数据给出 n n n 个数&#xff0c;每个数为 0 0 0 或 1 1 1 。你可以选择从两边删数&#xff0c;求至少删几个数才可以使剩下的数总和为 s s s 。 如果不能达到 s s s &#xff0c;则输出 − 1 -1 −1 。 题目描述 Slavic h…

NAS使用小妙招丨系统域名配件

NAS&#xff08;网络附加存储&#xff09;使用主要涉及到系统安装与设置、域名绑定、以及配件选择与配置。以下将分别针对这三个方面进行详细阐述&#xff1a; 一、系统安装与设置 安装群晖NAS系统&#xff1a; 将NAS设备连接到网络和电源。 通过计算机浏览器输入设备的IP地址…

【RAG论文】文档树:如何提升长上下文、非连续文档、跨文档主题时的检索效果

RAPTOR Recursive Abstractive Processing for Tree-Organized RetrievalICLR 2024 Stanfordhttps://arxiv.org/pdf/2401.18059 RAPTOR&#xff08;Recursive Abstractive Processing for Tree-Organized Retrieval&#xff09;是一种创建新的检索增强型语言模型&#xff0c;它…

Python OCR 文字识别使用模型:读光-文字识别-行识别模型-中英-通用领域

介绍 什么是OCR&#xff1f; OCR是“Optical Character Recognition”的缩写&#xff0c;中文意为“光学字符识别”。它是一种技术&#xff0c;可以识别和转换打印在纸张或图像上的文字和字符为机器可处理的格式&#xff0c;如计算机文本文件。通过使用OCR技术&#xff0c;可…