研究文章|开放获取
金永弼,朴贤赞,洪哲浩,刘楚克那 “CRIM:有条件的重新映射,以提高固态硬盘的可靠性,最大限度地减少寿命损失“,科学的规划那 卷。2018年那 文章ID.8171096.那 10 页面那 2018年. https://doi.org/10.1155/2018/8171096
CRIM:有条件的重新映射,以提高固态硬盘的可靠性,最大限度地减少寿命损失
抽象的
固态驱动器(SSD)变得流行为主存储设备。然而,随着时间的推移,由于比特错误,SSD的可靠性降低,这造成了严重问题。已经提出了定期重新映射(PR)来克服这个问题,但它仍然具有临界弱点,因为PR增加了终身损失。因此,我们提出了条件重新映射调用方法(CRIM)以维持无需寿命的可靠性。Crim使用基于概率的阈值来确定调用重新映射操作的条件。我们评估使用真实工作量跟踪数据的Crim的有效性。在我们的实验中,我们发现,在5年保修期中,CRIM可以比PR延长SSD的寿命,最多可达12.6%到17.9%。此外,我们表明,与PR相比,根据典型的比特误差率,压力可以将SSD的误码概率降低到73倍。
1.介绍
固态驱动器(SSD)是基于NAND闪存的高性能和节能存储设备。近来,SSD越来越受欢迎,在高性能服务器中看到个人计算机的用途[1那2].特别是,SSD可以增强云存储系统的性能。数据中心中的云存储系统应考虑能源效率,性能和维护成本[3.那4.].在大规模云存储系统中,存储设备的更换成本会受到关注。ssd可能是关键的解决方案,因为它们的性能比硬盘驱动器(hdd)快得多,而且它们的成本比静态随机访问内存(SRAM)低得多。
但是,SSD具有可靠性问题,因为NAND闪存具有比特错误。比特错误降低了SSD的性能和生命周期[5.].特别是,生命周期的降低是一个严重的问题,因为它减少了可用的块的数量,而这些块是有限的资源。因此,延长寿命是一个重要而紧迫的需求,直到最近才有很多研究提出[6.-10].
许多ssd通过使用纠错码(error correction code, ECC)机制来处理比特错误,如BCH [11].然而,ECC并没有完全解决比特错误问题,因为ECC的纠错能力是不可扩展的。例如,BCH-512可以用512长度的代码纠正7位错误。BCH-32 k可以纠正259位错误,码长是BCH-512的64倍,但可纠正错误的数量仅为37倍。此外,元数据的功耗和额外空间分别增加了71倍和85倍[12].
之后,已经提出了更高级的处理位错误的方法:应用数据块的周期性重新映射(PR)[12].PR定期将容易出错的块替换为健康的块。然而,PR有一个关键的弱点,即PR降低了ssd的整体生命周期。因此,我们试图找到一种方法来最小化PR造成的寿命损失。
我们的关键观察是,生命周期损失的原因是在PR中调用重映射操作太频繁。作为解决方案,我们提出了CRIM,即基于失败可能性的重映射操作的条件调用。为了减少生命周期损失,CRIM只在满足一定条件时调用重映射操作。这个条件是基于比特错误发生的概率,它决定了目标块容易出错的程度。
对于评估,我们比较了不同工作量下的CRIM和PR。我们测试SSD在所有块耗尽之前可以存活多久,当块可用时SSD可以执行多少次写操作,以及SSD降低每种方法的误码概率有多少。在我们的结果中,使用CRIM, SSD的存活时间最多比PR多230天(5年保修期的12.6%)。CRIM比PR多承受326.77块写的时间,这意味着在中等写比的工作负载下,SSD比PR多运行17.9%的5年保固时间1)运行。同时,CRIM降低了比特误码率高达超过Pr,这意味着典型误码率的73倍改善[13在云数据中心。
|
我们的工作有两个贡献。首先,我们提出了一种基于误码发生预测的SSD可靠性方法。其次,我们的工作有助于降低ssd可靠性处理机制在生命周期损失方面的开销。
节2.1,介绍了SSD的背景,回顾了SSD中误码处理方面的工作。部分3.描述了我们终身劣化的问题。我们建议在部分中的主要思想1,部分5.提出了CRIM和PR的实验评估。最后,我们在部分结束7..
2.背景
2.1。SSD基础知识
本节解释ssd的一些关键概念,以帮助理解我们的工作。我们的工作重点是基于NAND闪存的ssd。
2.1.1。结构
典型的SSD存储设备由多个NAND闪存组成筹码.芯片包括死和几个刨在骰子中。一个平面被划分成几个部分块,每个块都有一个固定数量的页面.一个页面包含多个字节,它是使用加载/卸载页面缓冲区的读写操作的访问单元。擦除操作的基本单元是一个块.每个块包含一个数组记忆细胞.存储单元包括一个或多个位作为编码方法,如单层单元(SLC)、多层单元(MLC)和三层单元(TLC)。SLC有一个位数据:0或1。MLC和TLC有两位和三位数据。众所周知,一个单元中的许多位容易产生错误[14].
2.1.2。写作和擦除
页面在物理上不能被覆盖。因此,必须在每次新的写入之前执行擦除操作。块中的每个单元只能承受有限数量的erase操作,当单元的操作计数达到最大值(最大程序擦除(P / E)循环).
2.1.3。有些错误
在ssd中,单元中的数据可能会被损坏错过错误如读、写和保留错误.读取错误在执行读操作时发生。写错误是写入数据时的位错误。保留错误是数据写入后发生的位错误。在SSD设备中,每次写入数据时,SSD cell都会重新充电。然而,随着时间的推移,由于带电电子的自然泄漏,数据可能会损坏,这就是为什么会发生保留错误。数据写入后保留错误的时间为保留时间.保留错误被认为是最主要的位错误,而写错误是第二主要的位错误[12那15].因此,我们采用传统的考虑两种误差的比特误差模型[5.那16].评估SSD flash可靠性的标准度量是SSD的原始比特误差率(RBER),定义为每读取总比特数的损坏比特数[13].最近的一项研究评估了基于Google数据中心的数据的各种SSD设备的rber,并且MLC SSD中的RBER的典型值被报告为[13].
2.1.4。平均读写
为了避免上述“特定细胞磨损”,SSD采用耐磨调平技术。该技术允许数据写入在存储上均匀分布。通过算法实现闪光控制器倒置逻辑块地址到SSD中的不同物理块地址的算法来实现。检查块地址,以便为闪光灯控制器中的每个写请求进行磨损。
2.2。相关工作
我们的工作主要与研究有关,以提高储存可靠性。在SSD中,有两种传统方法可以提高可靠性:减少误码错误和减少误码的影响.
2.2.1。减少误码错误
减少保留错误发生,定期重新映射(PR)[12]及保留松弛(RR) [16机制已被提出。公关(12通过将数据映射到一个新块,周期性地刷新存储的数据,试图减少保留错误的影响。但是,PR有周期性刷新开销的限制,这会导致额外的生命周期损失。为了克服它,[12建议FCR。FCR具有与压棉相同的目标,但差异是刷新条件和粒度。我们在部分更详细地介绍了这些6..
RR (16]试图通过缩短刷新时间来放松NAND闪存的保留能力。但RR有一个限制,即最佳刷新时间取决于指定的数据中心工作负载。CRIM试图减少PR的寿命损失,不需要对刷新时间进行物理修改。减少写错误出现,基于磁盘的写入缓存(DW)[17]在hdd中用作持久写缓存。在DW中,写入ssd的所有数据首先被追加到hdd中,然后再迁移到ssd。但是,这种方法有一个限制,它需要额外的HDD存储设备。CRIM不需要任何额外的hdd。
2.2.2。减少误码错误
解决的办法就是数据有弹性.dfi - raid (Data differential redundant array of independent disks)[详细信息]18]通过SSD RAID提高数据可靠性。dfi - raid以冗余方式分配校验块,考虑到存储设备的年龄。然而,对于相同数量的数据,这种方法需要额外的存储设备;因此,这是昂贵的。CRIM不需要额外的存储空间。
下一个解决方案是减少编程干扰;两项研究[19那20.的建议。动态电压分配(DV) [19]试图通过缩放充电电压来降低干扰。但是,这种方法需要额外的设备存储容量由单元格数缩放。渐进式编程方法(PP)[20.[每个细胞(SLC-)基于逐步编程方法呈现了单级,以发现闪存的寿命。通过利用逐渐噪声劣化劣化,PP可以长时间维持位数据。然而,这种方法不定位现代SSD,例如基于MLC或基于TLC的SSD。Crim不需要特殊的编程方法,也不需要针对特定类型的SSD。
我们的方法,CRIM,涵盖了这两种方法,也有一个新颖的地方。CRIM试图通过有条件地限制重映射操作的调用来减少保留错误和写入错误。此外,CRIM采用了一种新的方法:预测比特错误的发生。在CRIM中,只有当目标块容易出错时才调用重映射操作。因此,CRIM可以有效地防止误码的影响。
3.问题:由于无条件重复导致的寿命劣化
本节解释由于无条件重映射操作而导致的问题生命周期降低。为了检查问题的影响,我们分析了一段重映射操作期间(两个重映射操作之间的时间)的生存期降低量。
首先,我们需要一个度量来定量评估ssd中的生命周期。很难知道SSD的确切生存期,因为它是通过在实际SSD上运行工作负载来度量的,直到所有块都不可用。相反,在许多SSD研究中使用了估计的寿命[12那17那19那20.].通常,SSD的寿命是通过可承受的P/E周期(内存单元可承受的P/E周期数)来估计的。例如,我们假设有一个SSD最大3k P/E周期,SSD中的所有块都有1k P/E周期。那么,可承受的P/E周期数是2k。然而,可承受的市盈率周期并不是直观的,因为这个指标不是基于时间的。因此,我们在SSD供应商的白皮书中使用了扩展的估计生命周期度量[14]如下:
这一寿命度量包括可耐用的P / E循环和UsagePerDay.请注意,UsagePerDay可以根据给定I/O工作负载的写操作数量而变化。WriteAmplification因子(WA)是量化写开销的常数。佤邦(14]是1.1。利用是总块的使用率。在[14].
作为工作负载特征,SSD的生存期可能会有所不同。特别是企业服务器中的SSD在JEDEC SSD标准中假定每天24小时处于活跃使用状态[21].通常,SSD耐力通常在满满的方面描述每天驾驶写作(DWPD)对于某个保修期(通常为3或5年)[22].此外,MLC SSD块的典型耐久P/E周期在最近的文献中被称为数字范围为3k到10k [22].例如,SSD的寿命估计与持久的P/E周期为3 K,容量为256gb和UsagePerDay256gb的内存大约是7.1年。但是,这里假设SSD的使用率为中等。如果我们假设企业服务器的寿命为10 DWPD,则寿命降低10%;严重影响服务器存储的维护成本和可靠性。
其次,我们需要知道公关研究中单个重新映射操作的额外成本[12].重新映射操作的步骤如下:首先,读出整个块的数据(阅读一个街区).第二,如有必要,逐页更正错误(修改内存页).第三,将修正后的块写入另一个空块(写一块).
最后,我们可以推断,重新映射操作的第三步降低了生命周期,因为第三步需要“写一个块”,而写操作降低了上述生命周期度量中的可承受P/E周期。也就是说,如果我们无条件地进行重映射,则约简生存期问题会不断发生。为了解决这个问题,我们需要有条件地应用重映射操作。
4.解决方案:条件重新映射调用方法
我们解决方案的基本思想是有条件地调用重新映射操作。这就像对无条件泛洪操作的过滤器。我们使用基于概率的阈值和基于以前研究的原始比特误码率(RBER)模型[5.那16来确定数据块将被重新映射的条件。数字1显示了CRIM的总体架构。白色框表示SSD的传统部件,黑色框表示CRIM的新部件。CRIM需要flash控制器中的两个主要软件组件街区生活 - 法官(BLJ),块寿命 - 保护(BLS).BLJ何时何时应用BLS,该BLS为目标块执行重新映射操作。
数字2演示了CRIM如何处理从主机传入的写和读操作。一开始CRIM等待主机的I/O操作(状态0),在典型的SSD中,每当发生读操作(状态1)就会进行ECC检查,这是SSD的传统行为[22].当ECC检查失败或发生写操作时,调用BLJ来预测目标块是否容易出错(状态2)。BLJ的详细信息在Algorithm中1.
|
在算法1那预计随着P/E周期的增加而增加,传统文献以指数形式报道其增长[5.那12].但是,在最近的文献中[13],作者已报道并证实其增长接近线性增长。因此,我们建立了一个基于一年RBER数据的线性RBER模型[5.].结果如下: 在哪里T.表示保留时间和C表示市盈率周期。我们使用反映NAND闪存典型错误率的值,该值对应于JEDEC标准(SSD工业标准[21在室温下(如25°C)。
是当前可用的P / E循环的金额,以及是P/E周期的变化量。我们可以很容易地得到通过具有时间戳的磨损级别管理方案;因此,我们可以将其代表为时间序列。然后,我们获得了通过一个移动平均滤波器通过反馈控制方式[23].移动平均滤波器根据最近传入的数据计算平均值;因此,它可以动态地反映工作负载的P/E周期消耗。此外,反馈控制是一种从时间序列数据中计算期望值的有前途的方法。使用这两种技术,BLJ可以预测适应动态工作负载。
ABER表示一种分类两种状态的标准:容易出错和正常的.可接受的原始误码率()是SSD可以在没有给定的SSD设备配置(例如ECC代码大小)下的任何工作负载的最大rber。SSD设备供应商或SSD标准通常指定他们的aber。例如,典型工作负载执行下的无法纠正的比特错误率应小于[24].RBER可以在一年之内增加,而不需要额外的操作,如由于保留错误而读或写。在CRIM中,我们通过计算一年内的最大保留错误率来得到ABER。工作负载执行会影响RBER增量,因为字节错误是通过写或读操作累积的。如果有一些工作负载要执行,RBER将比没有工作负载更快地达到ABER。因此,当下一次预测的预期RBER超过ABER时,CRIM将有条件地调用重映射操作。的比值可根据flash芯片的类型和出错概率等方面进行更改。然而,不依赖于特定的工作负载。
如果没有要长时间执行的工作负载,则保留错误可以通过数据年龄(=保留时间)累积。因为留存错误取决于时间,所以我们需要提前估计截止时间来减少留存错误。通过求解的方程来计算截止时间为了T..我们解释了附录中解决的问题,以及获得的解决方案T.如下:
我们将估计的时间称为“预期保留时间(ERT)”。当BLJ预测“容易出错”时,CRIM也会立即检查ERT值(图中的状态4)2).如果ERE值未过期,则CRIC在SSD空闲时懒惰地检查垃圾收集(GC)任务中的eRT值(图中的状态32).
当ERT过期时调用BLS(图中的状态5)2).然后,BLS根据2.
|
BLS将目标块状态设置为错误,并开始搜索免费块池中的新的免费块(图中的状态52).然后,BLS将逻辑地址重新映射到新块的物理地址。当空闲块池为空时,保持当前块映射关系。在此之后,如果出现块错误,它将被标记为坏块,并在SSD设备中的坏块管理器中不可用[25)(图中状态72).这不会影响传统的SSD结构,因为我们仅利用它。
当BLS成功完成重新映射,或BLJ预测“正常”时,重新计算ERT值以防止进一步的保留错误(图中状态6)2).
5.评价
我们评估的目的是表明CRIM在可靠性和寿命损失预防方面比PR表现得更好。所有用于支持这项研究结果的评估数据都存放在github存储库中(https://github.com/saintgodkyp/crim.git.).
评估点是两个。首先,我们进行Crim和Pr(Pr-Day和Pr-Week)的可靠性分析。其次,我们评估了Crim和Pr的重复成本。
5.1。SSD配置和负载特性
我们的评估方法是一种分析模型验证方法,基于仿真获得的参数对现实工作负荷。我们使用带有SSD扩展的DiskSim 4.0模拟器收集工作负载特征,这在SSD研究中是常用的。我们将SSD配置设置为256gb,使用2 bit-MLC(4通道,每通道8芯片,每芯片8192块),这是典型的SSD配置,在PR中使用[12].我们使用PR中使用的各种真实工作负载跟踪数据。跟踪数据包括财务,Cello99,邮戳和MSR-Cambridge(MSR),其读取比分别为23%,38%,52%和80%。从跟踪数据中,我们提取所有DWPD的工作负载。此外,我们考虑JEDEC标准中的应用程序[21].有两个类:客户机和企业服务器。在DWPD方面,我们假设一个客户机(jdes -client)有1个DWPD,而两个企业服务器(jdes -server-1,2)有10到30个DWPD。我们将工作负载分为三类,即写比率(WR),并在下表中按照DWPD总结我们的工作负载特征1.
5.2。评价结果
5.2.1。可靠性分析
为了评估SSD的可靠性,我们模拟了典型的重映射方法(PR-day和PR-week)和CRIM。我们的模拟程序是使用Python代码(版本3.5.2)编写的。我们假设我们的SSD设备存储容量为256gb,每个块的持久P/E周期为3k,模拟时间为5年,这是PR中使用的典型SSD配置[12].
我们将工作量特征应用到它们中,并进行可靠性分析。为了分析SSD的可靠性,我们测量了“平均故障时间(MTTF)”、“剩余P/E周期”和“最后RBER”。首先,“MTTF”是一种经典的可靠性分析方法[26]通常用于评估系统可靠性。高MTTF意味着更可靠。在SSD上下文中,我们考虑无法完全耗尽可用的SSD块。
桌子2显示了MTTF的结果,并保持了市盈率周期。我们根据写比率将结果分为三个工作负载类:低、中、高。“MTTF”列显示每个工作负载类的平均MTTF。对于较低的保修期,所有方法均满足五年保修期;即所有方法的mtf都是5年(1825天)。在这种情况下,由于低WR的DWPD所消耗的总P/E周期小于可承受的P/E周期,所以一些可用的块仍然存在。例如,表中OLTP工作负载的DWPD为0.141.如果我们通过OLTP工作量在五年内考虑纯粹消耗的P / E循环,整个P / E循环约为256().市盈率周期远低于可承受市盈率周期(3 K);因此,还剩下2744个可用块。但是对于中型WR,所有方法都不能达到保修期。中期WR中pr日MTTF为5年的50.26%,pr周MTTF为61.68%。中等WR的CRIM为62.89%,是最长的MTTF。CRIM可存活230天或超过pr日,22天或超过pr周。在最糟糕的情况下,对于高WR,除了CRIM以外的所有方法都不能达到5年保修期的10%。在保修期日,当达到保修期的9.37%时,SSD已经不可用。PR-week显示MTTF为9.95%的保修期。 CRIM shows the longest MTTF of 10.05% of warranty period, and this result is 12 days and 2 days longer MTTF than PR-day and PR-week. These several days are precious time for handling SSD device failures; thus, CRIM can save the time.
|
为了清楚地展示云杉的有效性,我们计算了对阵PR-DAY和FR周的平均寿命增益3..结果表明,与PR相比,CRIM最多可以延长SSD的使用寿命230天,相当于5年保修期的12.6%。
其次,“剩余P/E周期”表示SSD在未来的使用时间,即当前可用的生命周期。市盈率周期越大越好。表中的“cycles”列2显示运行每个工作负载后剩余的P / E循环的结果。对于低WR,PR-DAY和PR-WHONE平均显示了206.36和486.55的剩余的P / E循环。Crim显示了533.13的最佳结果。对于中等WR,所有工作负载都将邮戳或更多的工作量或更多的P / E循环运行。PR-DAY显示零的剩余P / E循环的最糟糕的结果。Pr-Week显示0.72,但是压棉显示最大的0.93。对于高WR,所有方法在5年保修期间无法生存;因此,所有方法都显示出剩余的P / E循环的零。从最佳结果,Crim将剩余的P / E循环节省高达最大326.77,并且剩余的P / E循环,介质写入比的工作量(例如,表中的Jedes-Client1)可以将更多的时间延续超过3年的5年保修。
第三,“最后一个rber”意味着当SSD操作对目标块执行时会发生多少位错误。Low Last Rber显示了更好的可靠性。简而言之,为了更好的可靠性,目标方法应该具有更高的MTTF,更大的P / E循环和更低的最后一个rber。我们总结了图的平均最后一个rber4..对于每个WR,我们在完成所有块写入后测量最后一个rber,并且值缩放 .在较低的WR中,公关日和公关周的最后一个RBER分别为219.29和63.03。CRIM的RBER最佳,为37.06;因此,错误率是最低的。中等WR中,pr日和pr周的最后RBER分别为326.14和295.19。CRIM的RBER最佳,为286.61;因此,在三种方法中错误率最低。对于高的WR, CRIM也显示了最低的最后RBER,但所有方法都有324或更多的高RBER。这是因为高WR的工作负载会快速消耗可用P/E周期,而写错误会严重影响整个比特错误,而不是保留错误。
我们总结了Cir在图中的可靠性的收益5..可靠性改进如图所示5.表示相对于PR方法(PR-day和PR-week), CRIM减少平均最后RBER的多少。计算公式如下:
对于低WR和中WR的工作负载,CRIM可以提高SSD块访问的可靠性,平均最高可达83%。在高WR的工作负载下,由于大量的写错误,CRIM没有显示出有效性。从最好的结果来看,CRIM比PR更能降低误码概率高达 .考虑到典型的误码率-[13[Crim是否比Pr更多的73倍改善。
5.2.2。重新映射成本
为了分析降低SSD可用寿命的重映射成本,我们使用PR-day、PR-week和CRIM分别计算低、中、高WR工作负载的每个额外P/E周期的平均值。也就是说,更多的附加P/E周期意味着更多的终身损失。在图6.,我们可以看出,最大的CIR-BEST的平均寿命损失仅为0.67,这是所有方法中最小的。该结果表明,CRIM可以有效地除以预约调用数百或更多的重新映射操作(在PR日和PR周中最多1824和260个操作)。请注意,Crim在图中显示了更好的终身增益3.,这就是它的原因。
6.讨论
PR的最新技术是[12].它具有与压棉相同的目标,但也具有差异。因此,我们讨论了两个问题:什么是不同的点,是什么是云彩的好处。不幸的是,自适应速率FCR不是开源软件;因此,难以在运行代码级别用CRIM准确地比较它。相反,我们尝试使用调整自适应速率FCR中刷新周期的逻辑进行比较云彩。
6.1.共同点与不同点
通常,CRIM和Adaptive-rate FCR都有相同的目标,即减少刷新开销和提高生命周期。显著的差异有两个:刷新条件和粒度。刷新条件决定何时调用刷新。刷新粒度指示刷新调用的精确程度。
关于脉冲中的刷新条件,当SSD块故障高度预测时,调用刷新任务。CRIM通过预测模型预测块访问失败,并根据预测结果执行条件重新映射。在自适应速率fcr中,在通过刷新率调整的刷新周期,调用刷新动作。随着P / E循环降解,自适应速率FCR调节从低到高电平的刷新率。
卷曲的刷新粒度正常颗粒作为写入间隔。当提出写请求时,触发了CRIM的块生命判断(BLJ)。无论写入之间的时间间隔长度如何,在下一个写入时间时,BLJ就会考虑当前位误差率和可用的P / E循环时的错误易发状态。自适应速率FCR的刷新粒度仅限于最高刷新率的每日刷新。自适应速率FCR可以将刷新率从No-Refresh变为日常刷新;它不提供比每日率更精确的速率[12].
简而言之,通过预测写入刷新,通过在调整后的速率上定期刷新,通过预测刷新,通过预测刷新来缓解位误差。此外,CRIM提供一种使用写入间隔的细粒度刷新,并且自适应速率FCR提供粗粒刷新(从日常刷新到无刷新)的粗粒率。
6.2。罪犯的好处
从上面的两种差异,卷曲比自适应率FCR有两个好处。首先,Cim可以在现代操作系统中处理更多的位误差,而不是自适应速率FCR。从与CRIM和Adaptive-Rate FCR的比较来看,我们认为自适应速率FCR无法处理的比特错误。这些未处理的位错误可以恶化现代操作系统的文件系统中的一致性。现代OSS通常使用基于日记的文件系统(例如,Linux ext4和BSD日志结构文件系统(LFS))来维持文件系统内存内存中内存和磁盘数据之间的一致性。这些文件系统周期性地生成许多写入请求,以在每个检查点(刷新的周期性时间为SSD存储,通常秒:例如,Linux Ext4中的五秒钟()https://www.kernel.org/doc/Documentation/filesystems/ext4.txt))。因为对块的写入可以每秒发生一次,所以误码率可以每秒增加一次。但是,Adaptive-rate FCR不能刷新它们,因为它的最小刷新率是每天(24小时)。因为CRIM不会错过任何写操作,所以当它预测一个容易出错的状态时,写操作上的位错误可以刷新。
其次,在现代操作系统中,CRIM比自适应率FCR更能延长生命周期。自适应速率FCR的刷新率随可用P/E周期的减少而增加。当应用最高速率的每日刷新时,Adaptive-rate FCR每24小时调用一次刷新。如果刷新率为每日,则意味着可用的市盈率周期较低。然而,在24小时内,比特错误发生的概率很高。在低可用P/E周期下,比特错误产生块访问失败,然后在块访问失败时间确定其MTTF。然而,无论周期如何,CRIM都可以处理比特错误;因此,它可以扩展块的MTTF,因为CRIM已经在之前的写时间提前映射了它。
7.结论
通过定期块映射(PR),可以提高ssd的可靠性。但是,它有一个局限性,即PR会造成额外的寿命损失。我们提出了一种新的方法CRIM,通过有条件地调用重映射操作来减少额外的生命周期损失。在我们的实验中,我们发现,在5年保修期中,CRIM可以比PR延长SSD的寿命,最多可达12.6%到17.9%。在典型误码率方面,与PR相比,CRIM可将SSD的误码率降低73倍。
附录
求解期望保留时间方程
原始rber等式如下:
我们的目标是解这个方程为了T.,目标方程为:
让我们定义K.和R.作为
那么,原始方程将是
现在,我们来解这个T.如下步骤。首先,减去K.术语在同一侧““签字,我们就得到。
二,分裂R.术语在同一侧“”标志;请注意,R.不是零,我们得到了
在这里,让我们定义一个常数P.作为 那我们得到了
接下来,我们用带底的对数E.在同一侧““签字,我们就得到。
然后,我们得到T.将指数排列为:
最后,我们得到了预测T.将所有常数代入方程K.那R.和P.如下:
数据可用性
本研究中使用的数据可以从链接利用https://github.com/saintgodkyp/CRIM或根据要求从相应的作者。
的利益冲突
作者声明他们没有利益冲突。
致谢
本研究由韩国科学与信息技术部(MSIT)支持,SW Starlab支持项目(IITP-2018-2015-0-00280)资助,IITP(信息与通信技术促进研究所)指导。这项工作还得到了韩国政府(MSIT)资助的IITP的部分资助(no。2015-0-00288,面向SDN 2.0实现的网络虚拟化平台与服务研究这项研究也得到了高丽大学的资助。
参考文献
- B. K. Debnath,S. Suengupta和J. Li,“ChunkStash:使用闪存加速内联存储重复数据删除,”USENIX年度技术会议论文集,2010年6月,美国马萨诸塞州,美国。视图:谷歌学者
- B. Debnath, S. Sengupta, J. Li, " Flashstore:高吞吐量持久化键值存储"VLDB捐赠的诉讼程序,第3卷,第2期。1-2,第1414-1425页,2010。视图:出版商的网站|谷歌学者
- A. Beloglazov,R. Buyya,Y.C. Lee等,“节能数据中心和云计算系统的分类和调查”,电脑的发展,第82卷,第2期2, pp. 47-111, 2011。视图:出版商的网站|谷歌学者
- a . Elzeiny, a . a . Elfetouh和a . Riad,《云存储:一项调查》,计算机科学新兴趋势与技术杂志(IJETTCS),第2卷,第2期4, pp. 342-349, 2013。视图:谷歌学者
- N.Mielke,T.Marquart,N.Wu等,NAND闪存记忆中的“位错误率”2008年IEEE国际可靠性物理研讨会论文集,第9-19页,IEEE,菲尼克斯,美国,2008年5月。视图:出版商的网站|谷歌学者
- G. YADGAR,E. Yaakobi和A. Schuster,“写一次,免费获得50%:使用Wom Codes保存SSD擦除成本,”第13届Usenix档案和储存技术会议的程序(快速15),页257-271,圣克拉拉,加州,美国,2015年2月。视图:谷歌学者
- 梁勇,柴勇,鲍南,陈辉,刘玉玲,“一种用于缓存替换算法的SSD寿命扩展插件”第9届ACM国际系统和储存会议的诉讼程序,p。5,ACM,海法,以色列,2016年6月。视图:出版商的网站|谷歌学者
- T. Kim, S. Lee, J. Park,和J. Kim,“使用重复数据删除辅助的部分条带写的基于ssd的raid的有效生命周期管理”2016年第五届非易失性记忆系统和应用研讨会(NVMSA)的诉讼程序, pp. 1-6, IEEE, 2016年6月。视图:出版商的网站|谷歌学者
- S. Moon和A. Reddy,“raid能提高SSD阵列的寿命吗?”ACM存储学报(TOS),第12卷,第2期3,第11页,2016。视图:出版商的网站|谷歌学者
- C. Wang和S. Baskiyar,《延长二级存储的闪光寿命》,微处理器和微系统公司第39卷第3期3, pp. 167-180, 2015。视图:出版商的网站|谷歌学者
- h . Imai表示错误控制编码技术的必要性,学术出版社,马萨诸塞州剑桥,2014。
- Y.Cai,G. Yalcin,O.Umulu等,“闪光正确和刷新:保留感知错误管理增加闪存寿命,”2012年IEEE第30届计算机设计国际会议(ICCD)的诉讼程序,第94-101页,蒙特利尔,加拿大,2012年9月。视图:出版商的网站|谷歌学者
- B. SCHROEDER,R. Lagisetty和A.商家,“生产中的闪存可靠性:预期和意外,”第十四届USENIX会议论文集。文件与存储技术(FAST ' 16),pp.67-80,圣克拉拉,加州,美国,2016年2月。视图:谷歌学者
- A. R. Olson和D. J. Langlois,《固态硬盘数据可靠性和寿命》,汉语白皮书,第1-27页,2008。视图:谷歌学者
- S. Tanakamaru, C. Hung, A. Esumi, M. Ito, K. Li, K. Takeuchi,“具有非对称编码和条纹模式消除算法的智能固态硬盘(SSD)”IEEE固态电路会议论文集,pp.204-206,IEEE,旧金山,加利福尼亚州,2011年2月。视图:出版商的网站|谷歌学者
- R.-S.刘,C.-l.杨和W.Wu,“通过保留放松优化NAND闪存的SSD,”第十届USENIX文件和存储技术会议论文集,第11页,USENIX协会,圣何塞,加利福尼亚州,美国,2012年2月。视图:谷歌学者
- G. Soundararajan, V. Prabhakaran, M. Balakrishnan和T. Wobber,“使用基于磁盘的写入缓存延长SSD寿命”程序快速的10,第101-114页,加州圣何塞,美国,2010年2月。视图:谷歌学者
- M. Balakrishnan, A. Kadav, V. Prabhakaran, D. Malkhi,《差分raid:对SSD可靠性的重新思考raid》,ACM存储学报(TOS),第6卷,第2期2, p. 4, 2010。视图:出版商的网站|谷歌学者
- T.-Y。Chen, A. R. Williamson,和R. D. Wesel,“通过动态电压分配增加闪存寿命的恒定互信息”,在2014年信息理论与应用研讨会论文集, pp. 1-5, IEEE, 2014年2月。视图:谷歌学者
- G. Dong,Y. Pan和T. Zhang,“使用寿命感知逐行编程改善SLC NAND闪存写入耐久性”IEEE超大规模集成(VLSI)系统汇刊第22卷第2期6、pp. 1270-1280, 2014。视图:出版商的网站|谷歌学者
- JST协会,固态硬盘(SSD)要求和耐久性测试方法, jedec standard, jesd218b。01,日本,2016年。
- R. W. Kaese,“SSD用户的闪存基础”OpenZFS欧洲会议的诉讼程序,pp.1-15,OpenZFS,巴黎,法国,2015年6月。视图:谷歌学者
- J. L. Hellerstein, Y. Diao, S. parkh, D. M. Tilbury,计算系统的反馈控制, John Wiley & Sons,霍博肯,新泽西州,美国,2004。
- S. Tanakamaru, M. Fukuda, K. Higuchi等,“高可靠固态硬盘ssd的后制造,可接受的原始比特误码率提高17倍,动态码字过渡ECC方案”,固体电子学,第58卷,第2期1, pp. 2-10, 2011。视图:出版商的网站|谷歌学者
- JST协会,NAND闪存中的坏块管理, ST Microelectronics, APPLICATION NOTE, AN 1819, Geneva, Switzerland pp. 1-7, 2004。
- c .阳极定流IEEE可靠工业和商业电力系统设计推荐实践,Ieee,纽约,纽约,美国,1991年。
版权
版权所有©2018 Youngpil Kim et al。这是一篇发布在创意公共归因许可证,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。