当前位置: 首页 > news >正文

磁带存储:“不老的传说”依然在继续

现在是一个数据指数增长的时代,根据IDC数据预测,2025年全世界将产生175ZB的数据。

图片

这里面大部分数据是不需要存储的,在2025预计每年需要存储11ZB的数据。换算个容易理解的说法,1ZB是10^18Bytes, 相当于要写5556万块容量18TB的硬盘。

图片

这些存储的数据中,仅10%认为是Hot频繁访问的数据,90%的数据都将是Warm/Cold温冷数据, 也就是不经常访问的数据。举个简单的例子,我们目前每人至少1部智能手机,里面存储大量的照片、视频、聊天记录等个人隐私数据,这些数据自产生后,我们开始可能会经常访问,在3个月以后,你还会对着数据有访问的诉求吗?这个概率基本会下降到1%以下。

图片

从概率统计学来讲,超过3个月(90天)不再访问的数据,我们都可以称为冷数据,归档数据。每年全世界有25-35%的新增归档冷数据需要存储。这个市场的需求是非常的庞大。

图片

目前归档冷数据的最终归属大多数是基于HDD,SMR,磁带Tape等介质的冷存储系统。冷存储系统的最大的优点就是成本低和数据保留时间长,但是也带来相应的缺点就是冷归档数据读取过程需要“解冻”,数据访问响应时间拉长。

图片

从上图存储介质的出货量和类型数据,我们也可以看到,在2025年,机械硬盘包括SMR新型机械盘存储介质的占比仍然有50%。从20世纪30年代开始算的话,磁带技术也算是一位接近期颐百岁老人了,磁带技术虽然古老,但凭借独特的魅力依然挑起了世界数据存储的重担。

图片

根据最新的年度LTO(Linear Tape-Open,线性磁带开放标准)项目介质出货量报告,2023年磁带存储的出货容量达到了惊人的152.9EB(压缩后),相比2022年增长了3.14%,这一增长部分归因于“数据生成的快速增长以及超大规模运算和企业对基础设施需求的提升”,特别是人工智能领域的存储需求激增。

图片

LTO技术背后的三大合作伙伴——HPE、IBM和Quantum联合发布的这份报告揭示了磁带存储生命力顽强的一面。在过去的十二年里,尽管固态硬盘(SSD)和传统硬盘驱动器(HDD)等新存储技术不断涌现并逐渐成为主流,磁带存储非但没有消亡,反而在特定领域持续发挥其独特优势。

磁带存储之所以能保持一席之地,原因有三:

  1. 巨大容量与离线便捷:磁带提供了庞大的存储空间,并且易于脱机保存,这对于长期存档和不频繁访问的数据而言非常合适。

  2. 耐用性和长期安全性:磁带介质被证实可以安全地保存数据长达30年,对于长期数据保护和避免如勒索软件攻击的风险尤为重要。

  3. 成本效益与环境友好:在成本方面,尤其是对于备份和档案存储,磁带经常比硬盘更经济,同时其环境影响也小于HDD和SSD,符合绿色存储的趋势。

然而,磁带存储的主要局限在于数据访问速度慢,恢复过程可能较为耗时,这使得它更适合用于冷数据存储,即那些不经常访问的信息。

扩展阅读:

  • 告别emo|HDD&磁带:我的春天来了

  • LTO助推磁带大容量存储技术超越磁盘HDD

  • 为LTO磁带而生的文件系统LTFS|主线任务—夺回"秋雅"

  • LTO磁带 PK 磁盘HDD:谁会让数据中心变"绿"?

  • 大容量疯了!居然想把磁带放到硬盘,100TB+是否可以实现?

对比硬盘的出货容量,磁带虽然在总量上显示出增长,但两者在市场定位和应用场景上存在显著差异。例如,仅希捷一家硬盘制造商在2024年第三季度就出货了99EB的硬盘,显示出硬盘在活跃数据存储市场的主导地位。因此,磁带和硬盘各有千秋,分别服务于不同的存储需求和场景,共同支撑起现代数据存储的广阔天地。磁带的“不死传说”证明了,在技术快速迭代的今天,每一种存储解决方案都有其不可替代的价值和存在的理由。

扩展阅读:

  • 深度剖析:大容量QLC SSD为何遭疯抢?

  • SSD与HDD仍然共存,并将长期共存!

此前,Spectra Logic 和 Geyser Data 联手推出了一项名为 TAPAS(Tape Archive Platform As-a-Service)的创新服务,标志着业界首次将磁带存储以服务的形式提供给用户。这项基于订阅的服务允许即时配置、按需扩展,并且使用过程中无需专业的知识或技能,为用户提供了简便、经济的磁带存储解决方案。

图片

TAPAS 服务的核心特点:

  1. 即时且可扩展:TAPAS 提供的磁带存储基于订阅模式,用户可以根据需求即时获取服务并进行扩展,无需前期大量投入或专业知识。

  2. 成本效益:与典型的云冷存储服务相比,TAPAS 承诺提供更经济的解决方案,通过结合 Spectra Logic 的成熟磁带技术与 Geyser Data 的现代化服务交付模型,降低了长期存储成本。相比 AWS S3 归档,TAPAS 数据检索更快且无访问或提取费用,甚至可选服务将磁带快递至用户。

  3. 高性能与安全性:结合 Spectra Logic 的 Cube 图书馆系统、LTO-9 磁带媒体以及 BlackPearl S3 对象存储,TAPAS 提供了一个与 AWS S3 和 Glacier 兼容的系统,确保数据安全且易于访问。

  4. 灵活的数据管理:Geyser Data 的 TaaS 软件负责服务的配置、管理、监控、计费和实例化,简化了用户端的操作流程。

  5. 数据控制与隔离:Geyser Data 保证每个磁带只存储一个客户的资料,并允许客户掌控加密密钥,增强数据安全性和隔离性,减少网络威胁风险。

  6. 环保与合规:利用磁带存储的环保特性,TAPAS 同时解决了数据驻留、本地化或主权问题,让用户能够指定数据的实际地理位置。

还有富士Fujifilm,作为磁带存储介质的生产商和倡导者,最近推出了面向档案存储的Kangaroo融合系统,并即将发布一款针对中小企业的“Lite”版本

图片

Kangaroo系统简介:

  • 原始版本:包含120盘LTO磁带,采用带有轮子的箱体设计,配备集成鼠标和屏幕、不间断电源(UPS)及公司的对象存档软件。该单元可存储高达1PB的数据,标价最高达€350,000(约$375,000)。

  • Lite版本:为中小企业提供存储容量上限为100TB的解决方案,价格低于€100,000(约$107,000),旨在降低准入门槛,使更多企业能够利用磁带存储技术。

富士欧洲执行副总裁Peter Struik在罗马举办的IT Press Tour上透露,轻量级的Kangaroo Lite预计将于当年7月或8月面市。他提到,欧洲的一些大型机构已经测试并采用了标准版Kangaroo系统,包括卢森堡银行、一家健康机构和荷兰的一所大学。此外,还有两台设备正在运往英国,用于商业市场的试用推广。

相比硬盘存储,磁带存储能减少95%的碳排放。考虑到硬盘通常需要持续供电以保持数据随时可访问,而Kangaroo系统设计主要为离线使用,这一环保优势更为显著。公司还指出,企业数据中有70%属于“冷数据”,并不立即用于业务运营,但仅有5%的冷数据被存储在如磁带这类成本效益更高的系统上,表明磁带存储在节能减碳方面具有巨大潜力。

参考文献

1.https://www.tomshardware.com/pc-components/storage/tape-shipments-increased-to-1529-exabytes-in-2023-pretty-lively-for-a-dead-storage-medium

2.https://blocksandfiles.com/2024/05/15/spectra-logic-geyser-tape-as-a-service/

3.https://blocksandfiles.com/2024/04/12/fujifilm-kangaroo-lite/


如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

  • 浅析3D NAND多层架构的可靠性问题

  • SSD模拟器MQSim简介与资料分享

  • 孙凝晖院士万字长文|人工智能与智能计算的发展

  • 探究NVMe SSD HMB应用场景与影响

  • 深度剖析:大容量QLC SSD为何遭疯抢?

  • SSD突然掉电,是谁保护了用户数据?

  • 漫谈HAMR硬盘的可靠性

  • 万物皆可计算|下一个风口:近内存计算

  • SSD数据错误如何修复?

  • CXL与PCIe世界的尽头|你相信光吗?

  • 全景剖析SSD SLC Cache缓存设计原理

  • 存储革新:下一代低功耗PCM相变存储器

  • 3D DRAM虽困难重重,最快明年到来

  • 字节跳动入局存储内存SCM

  • PCIe 7.0|不要太卷,劝你先躺平

  • SSD LDPC软错误探测方案解读

  • 关于SSD LDPC纠错能力的基础探究

  • 存储系统如何规避数据静默错误?

  • PCIe P2P DMA全景解读

  • 深度解读NVMe计算存储协议

  • 对于超低延迟SSD,IO调度器已经过时了吗?

  • 浅析CXL P2P DMA加速数据传输的原理

  • HDD回暖于2024,与SSD决战于2028

  • FIO测试参数与linux内核IO栈的关联分析

  • NVMe over CXL技术如何加速Host与SSD数据传输?

  • 浅析LDPC软解码对SSD延迟的影响

  • 为什么QLC NAND才是ZNS SSD最大的赢家?

  • SSD在AI发展中的关键作用:从高速缓存到数据湖

  • 浅析不同NAND架构的差异与影响

  • SSD基础架构与NAND IO并发问题探讨

  • 字节跳动ZNS SSD应用案例解析

  • CXL崛起:2024启航,2025年开启新时代

  • NVMe SSD:ZNS与FDP对决,你选谁?

  • 浅析PCI配置空间

  • 浅析PCIe系统性能

  • 存储随笔《NVMe专题》大合集及PDF版正式发布!

如果您也想针对存储行业分享自己的想法和经验,诚挚欢迎您的大作。
投稿邮箱:Memory_logger@163.com (投稿就有惊喜哦~)

《存储随笔》自媒体矩阵

图片

相关文章:

  • 数据结构(八)二叉树、哈希查找
  • Codeforces Round 948 (Div. 2) E. Tensor(思维题-交互)
  • 【前端学习——react坑】useState使用
  • 【AI基础】数据获取与整理、打标、增强方法、增强库imgaug
  • 【Linux】初识Linux和Linux环境配置
  • uniapp一些问题解决
  • 【国产中颖】SH79F9202U单片机驱动LCD段码液晶学习笔记
  • 第13章 层次式架构设计理论与实践
  • vs2013使用qt Linguist以及tr不生效问题
  • 用易查分制作研学活动报名,支持在线签名,一键导出报名统计表格!
  • java调用远程接口下载文件
  • 深度学习——卷积神经网络
  • 实战解析:爬取音乐每日推荐歌单并自动分享
  • TextFormField onSave 和onChange
  • 43-3 应急响应 - WebShell查杀工具
  • Android系统模拟器绘制实现概述
  • cookie和session
  • echarts的各种常用效果展示
  • ES6简单总结(搭配简单的讲解和小案例)
  • extract-text-webpack-plugin用法
  • JS字符串转数字方法总结
  • Linux gpio口使用方法
  • Nodejs和JavaWeb协助开发
  • PHP 使用 Swoole - TaskWorker 实现异步操作 Mysql
  • Promise面试题,控制异步流程
  • Python学习之路16-使用API
  • REST架构的思考
  • select2 取值 遍历 设置默认值
  • spring security oauth2 password授权模式
  • SpringCloud(第 039 篇)链接Mysql数据库,通过JpaRepository编写数据库访问
  • vue数据传递--我有特殊的实现技巧
  • 安装python包到指定虚拟环境
  • 创建一种深思熟虑的文化
  • 从地狱到天堂,Node 回调向 async/await 转变
  • 从零到一:用Phaser.js写意地开发小游戏(Chapter 3 - 加载游戏资源)
  • 给Prometheus造假数据的方法
  • 人脸识别最新开发经验demo
  • 使用docker-compose进行多节点部署
  • 微信开源mars源码分析1—上层samples分析
  • 携程小程序初体验
  • 正则表达式
  • RDS-Mysql 物理备份恢复到本地数据库上
  • Unity3D - 异步加载游戏场景与异步加载游戏资源进度条 ...
  • !!Dom4j 学习笔记
  • (1)常见O(n^2)排序算法解析
  • (编译到47%失败)to be deleted
  • (附源码)ssm码农论坛 毕业设计 231126
  • (企业 / 公司项目)前端使用pingyin-pro将汉字转成拼音
  • (五) 一起学 Unix 环境高级编程 (APUE) 之 进程环境
  • (一)eclipse Dynamic web project 工程目录以及文件路径问题
  • (一)为什么要选择C++
  • (原創) 系統分析和系統設計有什麼差別? (OO)
  • ***详解账号泄露:全球约1亿用户已泄露
  • .net core Swagger 过滤部分Api
  • .net framework profiles /.net framework 配置