全闪存数据中心即将到来

概述

在企业级存储市场中,闪存介质在性能敏感的工作负载中占据了主导地位。尽管基于完全闪存的企业级存储系统直到2012年才进入市场,但到2019年,高达80%或更多的主要存储工作负载收入来自全闪存阵列(AFA)。与此同时,HDD已逐渐被边缘化,主要用于更侧重容量和成本控制的次要工作负载,但它们仍占据了大约90%的存储企业数据。鉴于闪存半导体技术的持续进步,企业级存储领域正在热议HDD在数据中心的最终命运。

我们坚信,到2028年,几乎不会再销售新的全HDD存储系统用于数据中心计算。尽管一些HDD可能会继续销售以扩展尚未达到寿命终点的现有系统,但在过去的十年中,HDD的销售量显著下降。从2010年超过6.51亿个的销售高点,到2022年,销售量已经下降了近71%,仅为1.66亿个。

性能型机械硬盘(10K和15KRPM)的市场份额在不到十年的时间里基本上已经消失(被闪存取代),而中线机械硬盘(7200RPM)几乎主导了未来的HDD支出。尽管在过去十年中,10K和15KRPM HDD的每GB裸容量成本明显低于闪存,但在主要存储系统的生命周期内,其它成本因素的影响超过了这一差距,最终导致很少有企业愿意购买HDD来应对对性能敏感的工作负载。

正是这种趋势,最终将导致几乎所有剩余的企业级工作负载将闪存取代中线HDD,尽管在本十年内,闪存的裸成本预计不会降至低于HDD容量的裸成本。这对于将裸容量的GB成本在0.01美元至0.015美元之间的HDD与当前高出十到十五倍的闪存容量成本进行比较的人来说可能会感到意外。

存储系统在其可用寿命内的综合采购和管理成本

随着全闪存阵列(AFA)占据主要的存储支出份额,并逐渐淘汰性能型HDD,其原因在于AFA的总拥有成本(TCO)低于全HDD系统的TCO。有趣的是,购买一台与相同性能和容量的全HDD系统相当的AFA的前期成本实际上仍然更高,经济利益来自AFA寿命周期内更低的运营成本。随着QLC NAND的推出,闪存现在可以以与全HDD系统相媲美的价格替代容量和价格敏感的工作负载的HDD(甚至对于较大系统来说价格更低)。

这一降低AFA前期购买成本的趋势得益于以下几个发展因素:

  • 闪存介质成本GB每年下降约20%,而HDD的每GB成本每年只下降9%。
  • 闪存介质密度的提高导致了标准SSD已经具有比最新高容量HDD更高的容量,而且标准SSD的密度预测显示,到2025年设备容量将有两到三倍的优势。
  • Pure Storage DirectFlash技术的成熟——预计到2025年,将闪存存储设备密度提高到比标准SSD高得多的水平,并且在设备级别提高有效容量利用率至70-80%(与HDD的50-60%相比),这是Pure Storage当前能够提供与配置以满足特定性能和容量目标的全HDD系统相媲美的前期成本的原因。

“我们认为到2028年,HDD在数据中心中将构成一个小众市场的观点,这是基于仅可通过Pure Storage系统实现的电力、空间和劳动效率。”Pure Storage的闪存存储设备称为DirectFlash模块(DFM),目前(截至2023年下半年)我们已开始提供容量为75TB的DFM。到2024年底,我们计划提供容量为150TB的DFM,到2026年,容量将增加至300TB的DFM。与此同时,目前行业普遍提供2-20TB的HDD,到2026年可能会增加至25-30TB的HDD。

有效GB成本指标的兴起

HDD行业长期以来将裸容量的GB成本作为关键衡量指标。然而,对于经验丰富的存储管理人员而言,他们深知决定可存储多少数据的并非裸容量,而是有效容量。因为诸如格式化、数据缩减、数据保护(RAID或纠删码EC),以及在不影响性能的前提下可以存储多少数据等因素,共同决定了系统的有效容量。在这些因素中,除了数据缩减(提高有效容量)之外,其它因素都对全HDD系统施加了容量开销,降低了实际可用于存储数据的容量。那些支持较低有效容量的存储设备将迫使客户购买更多设备,以满足特定性能和容量目标。

“Pure Storage目前正在销售75TB的闪存存储设备,并且在行业中具有最高有效容量利用率的坚实路线图,将推出300TB的闪存存储设备。”当企业根据裸容量测量和比较竞争系统的成本时,它们最终必须应对有效容量问题(以及相关成本)。为什么不从一开始就解决这个问题呢?随着数据缩减、数据保护和系统级有效容量利用逐渐变得更加明晰,我们更加合理地关注GB的有效成本,而非裸容量。

选择设备容量构建全HDD存储系统

尽管当前有20TB以上容量的HDD,但在配置大型、多PB规模系统时,大多数企业不得不购买容量较低的设备。主要原因有两个:

  • 随着设备容量增加,IOPS并没有显著增加,这意味着随着设备大小的增加,每TB的IOPS下降(这是因为HDD仅限于每个磁盘一个读/写头,其I/O速度受到磁盘自身旋转速度的限制)。随着HDD填满,要以满足最低性能阈值的方式访问其所有数据的能力会下降,使得某一点之后的容量变得不太可用。因此,磁盘供应商通常建议不要将设备填满超过60-80%。
  • 随着设备容量的增加,数据写入或读取设备的带宽有限,导致重建时间逐渐延长。这可能会对性能和数据完整性构成风险。需要注意的是,HDD的可靠性明显不如基于闪存的设备,它们具有高达1.54%的年故障率,而且故障率会随着设备的年龄而增加。相反,DFM在设备级别提供了超过八倍的带宽,并且具有高达十倍更低的年故障率,使用寿命是HDD的两倍。

这些担忧导致许多企业在构建多PB存储系统时决定不使用最大容量的HDD。然而,HDD存储系统在竞争成本比较中通常使用它们支持的最大容量的HDD进行计算,尽管这通常不是实际部署在生产环境中的配置。

比较Pure Storage DirectFlash技术和HDD

Pure Storage的DFM(DirectFlash模块)在存储密度方面拥有巨大的增长优势,这促使设备级别的GB成本随着NAND闪存价格持续下降而迅速降低。与使用闪存转换层(FTL)和在每个设备中孤立控制器间接管理介质不同,我们的Purity存储操作系统可以直接全局管理介质(在系统级别)。这使得我们的系统能够提供更高的性能一致性、数据可用性、存储密度、容量利用率、耐久性、可靠性和设备寿命。

HDD技术:终结在即

相对于Pure Storage DFM,HDD唯一的优势在于它们在裸容量基础上成本较低。然而,全HDD系统在性能、可靠性、重建时间(使数据面临风险)、管理复杂性和成本方面都表现不佳,而且需要每三到五年进行全面的技术更新。企业可能认为裸容量的较低成本意味着基于HDD的系统购买成本更低。但这真的是这样吗?

当查看配置为相同容量点的系统的存储设备数量时,存储密度的优势开始变得明显。每个12TB的HDD的成本远远低于75TB的DFM,但你必须购买六倍以上的数量。在正常的读/写操作中,单个75TB的DFM消耗大约10瓦,而六个12TB的HDD消耗大约60瓦(6 x 10.1瓦)。而且,支持这些额外HDD的基础设施也大得多——更多的控制器、更多的机箱、更多的电源、更多的风扇、更多的电缆,以及更多的设备维护费用。所有这些额外的存储基础设施也更昂贵,购买更复杂,更难管理,消耗更多的电力,并占用更多的机柜和地板空间。

考虑到HDD逐渐接近30TB设备的发展,而Pure Storage将在2026年推出300TB的DFM,这种比较将如何改变格局。然而,请记住,为了有效地使用更大容量的标准HDD,必须克服性能和重建时间的问题。仅仅具备大容量的HDD并不能解决这些挑战。

还要记住,单个DFM可以提供数千倍于单个HDD的IOPS。当将这种性能密度与DFM的存储容量密度相结合时,可以确保更紧凑的Pure Storage基础设施比全HDD系统具有显著更高的基础设施密度。

Pure Storage DirectFlash与标准SSD

当前,SSD供应商提供基于QLC NAND闪存的设备。然而那些构建存储系统的供应商是否能够提供与DirectFlash相似的优势,而不是基于HDD的系统呢?

的确,标准SSD在性能、存储密度和可靠性方面都优于HDD,但它们在所有这些领域都不足以在短期内对企业级近线HDD构成生存威胁。但根据工作负载需求的不同,它们足以替代一些全HDD系统。然而,使用DirectFlash技术构建的Pure Storage系统在成本效益方面比标准QLC SSD高出两到五倍(比HDD高出多达10倍)。目前市场上容量最大的标准SSD是15TB设备,而Pure Storage则提供75TB设备(截至2023年),未来三年内,我们的存储密度优势将迅速增加。这足以对HDD的生存构成威胁。根据标准SSDGB的成本降低情况来推测,它们不能在十年内以成本效益的方式替代全HDD系统。但Pure Storage的DFM,以其比标准SSD高两到五倍的成本效益,使这成为可能。硬盘的终结取决于像Pure Storage DirectFlash这样的闪存介质技术的传播,而不是基于标准QLC SSD的存储系统的可用性。

DirectFlash与标准SSD有何不同

Pure Storage开发的DirectFlash技术与传统行业采用标准SSD策略有显著差异。Purity操作系统直接在系统范围内全局管理NAND闪存芯片,优化存储半导体,以提高性能、容量、可靠性和寿命。我们创建了专有的DFM,并以Purity和高容量DFM为基础,构建了针对各种存储需求进行优化的企业级存储系统。

与基于标准SSD的系统完全不同。SSD是由硬盘制造商设计,旨在使基于HDD的系统更容易迁移到闪存技术。为了在最初为HDD设计的存储系统中集成SSD,这些设备使用了与HDD硬件和软件完全相同的模块。因此,SSD可以作为通用设备用于消费者、商业和企业系统,而这些系统最初是为HDD设计的。但是,通过使用半导体来模仿机械设备,SSD显著减少了闪存技术的许多固有优势。

标准SSD具有FTL,使其模仿HDD,并需要处理大量HDD的遗留问题。虽然这使它们更容易集成到最初为HDD设计的存储系统中,但FTL相对于直接管理为闪存的闪存设备而言,会带来性能、介质可靠性、耐久性、容量利用率和成本的劣势。每个标准SSD中的介质由该设备内的控制器单独管理,无法看到存储系统中其它地方发生的情况,这种设计会导致性能不太可预测(特别是当存储设备填满时),写放大程度更大,容量利用率更差。

与当前大规模出货的15TB 标准QLC SSD相比,Pure Storage的75TB DFM在由Purity管理的情况下,在工作负载扩展时提供更一致的性能,将更多的板上空间用于数据,存储密度高五倍,可靠性提高五倍,挤出15-30%更高的容量利用率,以及比标准SSD低的设备级每TB成本。

Pure Storage在效率(以瓦/GB计)和存储密度(以TB/U计)方面领先于行业。这不是空洞的说法。通过75TB DFM,Pure提供了每TB远低于1W的系统级运行功耗和1–30PB范围内系统的1PB/U的存储密度。即使SSD供应商当前可以提供更大的设备容量,存储系统供应商也无法有效地利用所有容量。如果不能有效地使用额外的容量,更大容量的设备并不能降低GB的成本。Pure Storage的DirectFlash技术使系统能够使用和恢复非常大容量的设备。

总之,正是我们高密度的DFM和Purity存储操作系统的结合,使我们比标准SSD更优越2-5倍。DirectFlash技术构成了Pure Storage行业领先的存储基础设施效率的基础,竞争对手无法通过使用标准SSD来复制这一技术。