SP 科学的规划 1875 - 919 x 1058 - 9244 Hindawi 10.1155 / 2018/8171096 8171096 研究文章 罪犯:条件重新映射来提高固态硬盘的可靠性与寿命损失最小化 http://orcid.org/0000 - 0002 - 9154 - 2336 Youngpil 1 http://orcid.org/0000 - 0001 - 9879 - 5531 公园 Hyunchan 2 http://orcid.org/0000 - 0003 - 4730 - 950 x 在香港 Cheol-Ho 3 http://orcid.org/0000 - 0002 - 1115 - 1862 查克 1 Aldinucci 马可 1 信息学院 高丽大学 首尔 韩国 korea.ac.kr 2 计算机科学和工程的部门 全北国立大学 全州 韩国 cbnu.edu 3 电气和电子工程学院 Chung-Ang大学 首尔 韩国 cau.ac.kr 2018年 20. 9 2018年 2018年 03 05年 2018年 21 07年 2018年 17 08年 2018年 20. 9 2018年 2018年 版权©2018 Youngpil金等。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

固态硬盘(SSD)成为受欢迎的作为主要的存储设备。然而,随着时间的推移,SSD的可靠性降低,由于一些错误,这带来了一个严重的问题。周期性的重新映射(PR)已建议为了克服这个问题,但它仍然有一个关键的弱点随着公关增加寿命损失。因此,我们提出的条件重新映射调用方法(罪犯)维持可靠性没有一生的损失。罪犯使用概率阈值来确定调用重新映射操作的条件。我们评估的有效性罪犯使用真正的负载跟踪数据。在我们的实验中,我们表明,罪犯可以扩展一生的SSD公关多12.6%到17.9%的5年保修时间。此外,我们表明,罪犯可以减少一些错误概率的SSD 73倍的典型的比特误码率与公关相比。

科技部、ICT和未来规划 iitp - 2018 - 2015 - 0 - 00280 高丽大学 韩国政府(MSIT) 2015-0-00288
1。介绍

固态硬盘(SSD)是一种高性能和节能基于NAND闪存的存储设备。SSD已成为越来越受欢迎的在最近一段时间,看到使用的个人电脑在高性能服务器( 1, 2]。特别是,SSD可以提高云存储系统的性能。云存储系统的数据中心应该考虑能源效率、性能和维护成本( 3, 4]。在大规模的云存储系统中,存储设备的重置成本可以关注。ssd可以解决方案因为他们性能的关键是更快的硬盘驱动器(hdd),和他们的成本远低于静态随机存取存储器(SRAM)。

然而,SSD可靠性问题因为NAND闪存有一点错误。一些错误降低SSD的性能和寿命 5]。尤其是一生的退化是一个严重的问题,因为它减少了可用的块的数量是有限的资源。因此,提高寿命是一个重要的和紧急的需求,很多研究已经提出直到最近[ 6- - - - - - 10]。

许多ssd处理一些错误运用纠错码(ECC)等机制BCH ( 11]。然而,ECC并不完全解决一些错误的纠错能力问题,因为ECCs不是可伸缩的吗。例如,bch - 512可以正确代码长度以512 - 7位错误。BCH-32 k可以纠正259位errors-the代码长度超过64倍bch - 512但是矫正错误的数量只有37倍。此外,功耗和额外的空间元数据增加的倍数71年和85年,分别为( 12]。

之后,更先进的方法来处理一些错误已经建议:应用周期重新映射(PR)的数据块( 12]。公关定期替换容易出错块成健康的。然而,公关的关键弱点,公关减少ssd的整体寿命。因此,我们试图找到一种方法减少寿命损失造成的公关。

关键观察生命损失的原因是调用重新映射操作往往在公关。解决方案中,我们建议有罪的,条件重新映射操作的调用基于失败的可能性。减少寿命损失,有罪的调用重新映射操作只有在满足一定的条件。条件是基于一些错误发生的概率,它决定了一个目标块容易出错。

评价,我们比较罪犯和公关与各种工作负载。我们测试一个SSD可以存活多久,直到所有块耗尽,SSD可以执行写操作多少次当块,多少SSD减少一些错误概率为每个方法。在我们的结果,罪犯,我们表明,SSD可以通过最大生存时间比公关230天(5年保修时间的12.6%)。罪犯也可以忍受比公关326.77块写道,这意味着SSD可以更多的时间比公关17.9%的5年保修时间当一个工作负载中写比率(表 1)运行。罪犯也减少了一些错误的概率 182.23 × 10 8 在公关,这意味着73倍提高典型的比特误码率 2.48 × 10 8 ( 13在云数据中心。

摘要DWPD的测试工作负载。

写比率(WR) 媒介
工作负载 MSR 金融 OLTP JEDES-client 邮戳 Cello99 JEDES-server-1 IOzone JEDES-server-2
DWPD 0.005 0.05 0.14 1 2.8 5.5 10 20. 30.

我们的工作有两个贡献。首先,我们提出一个新颖的SSD可靠性的方法,是基于预测的错误发生。第二,我们的工作有助于减少可靠性处理机制的开销ssd的寿命损失。

2.1,我们解释SSD背景和复习以前的工作在SSD的一些错误处理。部分 3描述了我们一生的退化问题。我们建议罪犯的主要思想 1,部分 5提出了罪犯和公关的实验评价。最后,我们得出结论部分 7

2。背景 2.1。SSD基础知识

本节解释ssd援助的一些关键概念的理解我们的工作。我们的工作集中在NAND闪存内存的ssd。

2.1.1。结构

一个典型的SSD存储设备由多个NAND闪存 芯片。芯片由和一些 飞机在一个死亡。一架飞机是划分,每一块都有固定数量的 页面。一个包含多个页面 字节,它是一个访问单元读和写操作使用的装载/卸载页面缓冲区。一个擦除操作的基本单位。每个块包含数组 记忆细胞。一个存储单元包括一个或多个比特编码方法如单层细胞(SLC),多层细胞(多层陶瓷),triple-level细胞(TLC)。SLC有一些数据:0或1。多层陶瓷和TLC有两位和3位数据。众所周知,许多位在一个单元中容易出错( 14]。

2.1.2。写和擦除

一个页面不能覆盖身体。因此,一个擦除操作之前必须完成的每一个新的写作。每个单元在一块只能忍受有限数量的擦除操作,和一些数据在一个单元中无法保证保留当细胞的操作数达到最大计数( 最大program-erase (P / E)周期)。

2.1.3。有些错误

在ssd,数据可以被在一个单元中 有些错误 读、写和记忆错误 读取错误当执行读操作时发生。 写错误是写一些错误数据时。 保留错误一些错误发生后写的数据。在SSD,每次写数据的时候,SSD电池充电。然而,数据随着时间的推移可能会损坏由于自然泄漏的带电电子,这就是为什么保留错误发生。时间保留错误数据写入后 保留时间。保留错误被称为最主要的一些错误,并编写第二个占主导地位的一个[错误 12, 15]。因此,我们使用传统的位错误模型考虑两个错误( 5, 16]。标准的指标来评估SSD flash可靠性原始比特误码率(rb)的SSD,定义为损坏的数量位/读取的总比特数( 13]。最近的一项研究评估各种SSD的rb设备基于谷歌数据中心的数据,在多层陶瓷SSD和rb的典型值报告 2.48 × 10 8 ( 13]。

2.1.4。平均读写

为了避免上述“特定细胞磨损”,ssd采用损耗均衡技术。这种技术允许将数据写均匀分布在存储。flash的耗损均衡是通过一种算法控制器重新映射逻辑块地址SSD中不同的物理块地址。块地址检查每个写请求的平均读写flash控制器。

2.2。相关工作

我们的工作主要是相关研究,以提高可靠性的存储。在ssd,有两种传统的方法来提高可靠性: 减少一些错误出现 减少一些错误的影响

2.2.1。减少一些错误出现

减少 保留错误事件,定期重新映射(PR) ( 12)和保留放松(RR) [ 16已经提出机制。公关( 12]试图减少记忆错误的影响,定期刷新存储数据的数据映射到一个新的块。然而,公关的限制定期刷新开销导致额外的寿命损失。克服它,作者在 12)建议货代。货代有相同的目标是有罪的,但差异刷新条件和粒度。我们更详细地介绍这些部分 6

RR ( 16]试图放松NAND闪存的保留能力通过缩短刷新时间。然而,RR限制,最佳的刷新时间取决于指定的数据中心的工作负载。罪犯试图减少公关的寿命损失,不需要物理改性的刷新时间。减少 写错误事件,基于磁盘写缓存(DW) [ 17)中使用hdd持久写高速缓存。在DW,所有数据写入ssd首先被附加在hdd,和数据迁移到ssd。但是,这种方式有一个限制,它需要另外硬盘存储设备。罪犯不需要任何额外的hdd。

2.2.2。减少一些错误出现

一个解决方案是使 数据有弹性。数据微分独立磁盘冗余阵列(Diff-RAID) ( 18增强的SSD RAID可靠性的数据。Diff-RAID多余地分发校验块考虑到存储设备的时代。然而,这种方法需要额外的存储设备相同数量的数据;因此,它是昂贵的。罪犯不需要额外的存储空间。

下一个解决方案是 减轻编程干扰;两项研究[ 19, 20.已经提出。动态电压分配(DV) [ 19]试图减少干扰通过扩展充电电压。然而,这种方法需要额外的设备存储容量扩展到细胞的数量。先进的编程方法(PP) ( 20.)提出了一种单级每个细胞——(SLC)建立先进的编程方法发现闪光电池的寿命。利用噪声容限逐渐降低,PP可以维持一些数据了。然而,这种方法并不现代ssd MLC-based或TLC-based ssd等目标。罪犯不需要特殊的编程方法,也不针对特定类型的ssd。

有罪的,我们的方法包括两种方法,也有新奇。罪犯试图减少保留错误和书写错误通过有条件地限制重新映射操作的调用。罪犯也采用一种新方法:预测错误出现。在罪犯重新映射操作只有在调用目标块容易出错。因此,罪犯可以有效防止一些错误的影响。

3所示。问题:一生退化由于无条件重新映射

本节解释我们problem-lifetime退化由于无条件重新映射操作。为了检查的影响问题,我们分析的数量重新映射操作的寿命退化在一段时间内(两个重新映射操作之间的时间)。

首先,我们需要一个度量来评估寿命定量ssd。很难知道确切的SSD一生,因为它是通过运行工作负载来衡量实际的SSD,直到所有的块都不可用。相反,估计一生中使用SSD许多研究[ 12, 17, 19, 20.]。通常,SSD的一生是估计耐用P / E周期市盈率的循环次数,记忆细胞可以忍受。例如,让我们假定有一个SSD最大3 K P / E周期,和所有块SSD 1 K P / E周期。然后,耐用的P / E周期是2 K。然而,能忍耐的P / E周期并不直观,因为这个指标不是基于时间。因此,我们使用扩展的估计寿命指标在固态硬盘厂商的白皮书[ 14),如下: (1) 一生 = 能力 GB × EndurablePE 周期 × 利用 % UsagePerDay GB × WriteAmplification × 365年 天/年

此生指标包括耐用和P / E周期 UsagePerDay。请注意, UsagePerDay不同的写操作的数量给定的I / O工作负载。 WriteAmplification因子(WA)是一个常数量化写作开销。佤邦( 14)是1.1。 利用是一个总块的使用比例。积极利用SSD显示95% ( 14]。

工作负载特征,一生的SSD看起来不同。尤其是SSD在企业服务器承担积极使用电平SSD标准(每天24小时的 21]。通常,SSD耐力通常描述完整 每天开车写道( DWPD)确定保修期(通常3或5年) 22]。同时,典型耐用P / E周期多层陶瓷SSD块被称为数字范围3 K在最近的文献[10 K 22]。例如,SSD的估计寿命耐用3 K, P / E周期256 GB的容量 UsagePerDay256 GB大约是7.1年。然而,这种假设温和SSD使用。寿命降低10%如果我们假设10 DWPD的企业服务器;因此,它可以严重影响服务器存储的维护成本和可靠性。

其次,我们需要知道一个重新映射操作的额外成本公关研究[ 12]。重新映射操作的步骤如下:首先,一整块的数据读出( 读一个街区)。第二,如果有必要,纠正错误页面的页面( 修改内存页)。第三,纠正数据块写入到另一个空的块( 写一块)。

最后,我们可以推断重新映射操作的第三步降低了一生,因为第三步需要编写一个块,写操作减少耐用P / E周期在上面的寿命指标。也就是说,如果我们无条件地执行重新映射,一生会发生不断减少的问题。解决,我们的洞察力是应用重新映射操作条件。

4所示。解决方案:条件重新映射调用方法

我们的解决方案的基本思想是调用条件重新映射操作。这个运作就像一个过滤器对无条件洪水操作。我们用概率阈值和原始比特误码率(rb)模型基于以前的研究( 5, 16)确定数据块将重新映射的条件。图 1展示了罪犯的总体架构。white-filled框显示传统SSD组件和black-filled框显示为有罪的新组件。罪犯需要两个主要软件组件flash控制器, block-life-judge (BLJ), block-life-saver (BLS)。BLJ决定何时应用劳工统计局,执行重新映射操作为目标。

罪犯的总体架构。

2显示了传入的罪犯是如何工作的读写操作从一个主机。最初,罪犯等待I / O操作从一个主机(0)状态。在一个典型的SSD, ECC校验执行读操作时发生(状态1)。这是一个传统的SSD的行为( 22]。ECC校验失败或写操作发生时,调用BLJ预测是否目标块容易出错的细节(状态2)。BLJ算法 1

罪犯的状态图。

<大胆>算法1:< /大胆> Block-life-judge。

数据:当前市盈率周期的目标块(当前),P / E周期的预期增量价值(预期),可接受的误比特率(河口),保留时间(t)

结果:“出错”,“正常的”。

如果(rb ( t(当前预期+)) 河口) 然后

返回“出错”;

结束

其他的

回归“正常”;

结束

在算法 1, rb 预计将增加P / E的循环次数,和增长报告指数在传统文献[ 5, 12]。然而,在最近的文献[ 13),作者报告和验证了增长接近线性增加。因此,我们建立一个线性rb模型基于a-year-RBER数据报告( 5]。结果如下: (2) rb t , c = 9.991 × 10 10 c 1 + 1.0 × 10 9 + 4.485 × 10 4 × t 1.25 , 在哪里 t意味着保留时间和 c表明P / E周期。我们使用的值反映了NAND闪存的典型的错误率,对应于一个为期一年的数据保留能力中指定的电平标准(SSD工业标准( 21)在室温下(例如,25°C)。

当前的 当前可用的P / E周期,然后呢 预期 的数量改变P / E周期。我们可以很容易地获得 当前的 通过损耗均衡管理计划和一个时间戳;因此,我们可以将它表示为时间序列。然后,我们获得的 预期 通过反馈控制方式移动平均滤波器( 23]。移动平均滤波器计算基于最近的输入数据的平均值;因此,它可以反映动态改变P / E周期消耗的工作负载。同时,反馈控制是一种很有前途的方法从时间序列数据计算期望值。使用这两种技术,BLJ可以预测 预期 自适应的动态工作负载。

但代表一个标准分类两种状态: 容易出错的 正常的。接受原始比特误码率( 河口 )是最大的rb, SSD可以忍受没有任何负载下给定的SSD设备配置(比如ECC代码大小)。SSD设备供应商或SSD标准通常指定自己的河口。例如,不能修复的比特误码率下典型的工作负载执行应小于 10 15 ( 24]。rb可以增加在一年没有额外的操作,比如读或写的保留错误。在罪犯,我们得到汇流点通过计算最大保留错误率在一年。工作负载执行影响增量rb因为一些错误积累写或读操作。如果存在一些工作负载执行,rb将达到但速度比没有工作负载。因此,罪犯将调用重新映射操作条件下预测当预期的rb超过河口。的具体值 河口 可以改变根据flash芯片类型和错误概率方面。然而, 河口 不依赖特定的工作负载。

如果没有工作负载执行很长一段时间,保留错误可以通过数据积累的年龄(=保留时间)。因为保留错误取决于时间,我们需要估计最后期限提前时间来缓解它。我们通过求解的方程计算截止日期时间 rb t , c = 河口 t。我们在附录解释它是如何解决的,以及获得的解决方案 t如下: (3) t = e 日志 河口 9.991 × 10 10 c 1 + 1.0 × 10 9 / 4.4485 × 10 4 / 1.25

我们的名字估计时间为“预期保留时间(ERT)。“当BLJ预测”出错,“罪犯也立即检查ERT价值(状态4在图 2)。如果ERT价值不到期,罪犯检查ERT值懒洋洋地在垃圾收集(GC)的任务调用SSD时空闲(状态3图 2)。

劳工统计局ERT到期时调用(国家5图 2)。然后,执行重新映射根据劳工统计局 2

<大胆>算法2:< /大胆> Block-life-saver。

数据:目标块的逻辑地址(逻辑),目标块的物理地址(物理)

结果:“完成”

SetErrorPronePhysicalBlock(物理);

NewPhysical = GetFreePhysicalBlock ();

重新映射(逻辑、NewPhysical);

返回“完成”;

劳工统计局设置目标块地位容易出错,开始寻找一个新的空闲块在空闲块池(5图 2)。然后,劳工统计局重新映射的逻辑地址到物理地址的新块。当空闲块池是空的,当前的块映射关系。之后,如果一块错误发生,它被标记为坏块,变得不可用SSD的坏块管理设备( 25)(国家7图 2)。这并不会影响传统的SSD结构只因为我们利用它。

当劳工统计局完成成功地重新映射,或BLJ预测“正常”ERT价值是防止进一步保留重新计算错误(国家6在图 2)。

5。评价

我们评估的目的是证明有罪的执行比公关方面的可靠性和寿命损失预防。所有评价数据用于支持这项研究的结果已经存入github库( https://github.com/saintgodkyp/CRIM.git)。

评估点是两个。首先,我们进行的可靠性分析罪犯和公关(PR-day和公关周刊)。第二,我们评估罪犯的重新映射成本和公关。

5.1。SSD的配置和工作负载特征

我们的评估方法是一种基于参数分析模型验证方法从模拟在现实的工作负载。我们收集工作量特征使用DiskSim 4.0模拟器与SSD扩展,SSD中常用的研究。我们设置了SSD配置256 GB 2 bit-MLC(4通道,每通道8芯片,8192块每个芯片)这是一个典型的SSD配置和用于公关 12]。我们使用各种真实的负载跟踪数据用于公关。跟踪数据包括金融、Cello99,邮戳,和MSR-Cambridge (MSR),和他们的阅读率是23%,38%,52%,和80%,分别。从跟踪数据,我们提取的所有DWPDs工作量。同时,我们考虑在电平标准应用程序类( 21]。有两类:客户和企业服务器。DWPD而言,我们假设一个客户端(JEDES-client)有1 DWPD和两个企业塞维(JEDES-server-1, 2)从10到30 DWPD。我们工作负载分类成三个类写比率(WR),和总结我们的工作负载特征的DWPD在下表中 1

5.2。评价结果 5.2.1。可靠性分析

固态硬盘的可靠性进行评估,我们模拟典型重新映射方法(PR-day和公关周刊)和罪犯。我们的模拟程序是使用Python代码(3.5.2)版写的。我们假设SSD设备有256 GB的存储和每一块的耐用P / E周期3 K,和仿真时间是5年,这是一个典型的SSD配置用于公关( 12]。

我们应用工作负载特征并进行可靠性分析。分析SSD的可靠性,我们测量”平均故障时间(MTTF),”“保持P / E周期,”和“最后的rb。“首先,”MTTF”是一个典型的可靠性分析方法 26)是常用的评估系统的可靠性。高MTTF意味着更可靠。在SSD的背景下,我们认为未能完全耗尽可用SSD的街区。

2显示的结果MTTF和保持P / E周期。我们分类结果为三个工作负载类写的比:低,中,高。“MTTF”列显示每个工作负载的平均MTTF类。低WR,所有方法可以满足五年保修期;即,MTTF方法五年(1825天)。在这种情况下,一些可用的块仍然因为P / E消耗周期基于DWPD WR小于低耐用P / E周期。例如,DWPD OLTP工作负载在表0.14 1。如果我们考虑纯粹消耗P / E OLTP工作负载周期5年期间,整个P / E周期大约是256 ( = 1825年 × 0.14 )。P / E周期远远低于耐用P / E周期(3 K);因此,2744块仍然可用。然而,对于媒介WR,所有方法不能达到保修期。MTTF PR-day的媒介WR显示50.26%的5年,公关周刊之一是61.68%。罪犯在中型仓库收据显示,62.89%,这是最长的MTTF。罪犯可以生存230天或超过PR-day, 22天或超过公关周刊。在糟糕的情况下,对高WR,所有方法除了罪犯不能达到10%的5年保修期。在PR-day, SSD已经不可用的时候达到9.37%的保修期。公关周刊节目MTTF保修期的9.95%。 CRIM shows the longest MTTF of 10.05% of warranty period, and this result is 12 days and 2 days longer MTTF than PR-day and PR-week. These several days are precious time for handling SSD device failures; thus, CRIM can save the time.

结果mttf和保持P / E周期5年的保修期。

写的比 媒介
使用的指标 MTTF 周期 MTTF 周期 MTTF 周期
方法
PR-day 1825年 206.36 917.33 0 171年 0
公关周刊 1825年 486.55 1125.66 0.72 181.66 0
CRIM-best 1825年 533.13 1147.66 0.93 183.33 0

清楚地表明罪犯的有效性,我们计算的平均寿命增加对PR-day和公关周刊在图 3。从结果中,我们观察到罪犯可以扩展一生的SSD超过公关最多230天,这意味着12.6%的5年保修期。

平均寿命增加对公关的罪犯。

第二,“保持P / E周期”表示将来多久我们将使用SSD,即目前可用的一生。大保持P / E周期是更好。列在表“周期” 2显示的结果保持P / E周期在每个工作负载运行。低WR, PR-day和公关周刊显示保持P / E周期平均为206.36和486.55。有罪的显示了533.13的最好的结果。媒介WR,所有工作负载DWPD邮戳或更多耗尽可用的P / E周期。PR-day显示了一个最差的结果仍然P / E 0的循环。公关周刊显示0.72,但罪犯显示0.93最大的结果。对于高WR,所有方法无法生存在5年保修期;因此,所有方法显示零保持P / E周期。最好的结果,罪犯保存仍然最大326.77,P / E周期和保持P / E周期,一个工作负载的介质写比率(例如,JEDES-client表 1)可以运行更多的时间比公关17.9%的5年保修。

第三,“最后rb”意味着多少有些错误可以发生在SSD操作执行目标块。去年rb显示更好的可靠性低。简而言之,为了更好的可靠性,一个目标方法应该MTTF更高,更大的保持去年rb P / E周期和降低。我们总结去年rb平均图 4。为每个WR,我们测量最后rb后完成所有块写道,和值是按比例缩小的 10 8 。低WR,最后rb PR-day和公关周刊显示平均219.29和63.03。罪犯显示最好的rb 37.06;因此,出错率是最低的。为媒介WR,最后rb PR-day和公关周刊显示平均326.14和295.19。罪犯显示最好的rb 286.61;因此,出错率是最低的三个方法。高WR,罪犯也显示了去年rb最低,但所有方法有很高的rb 324或更多。这是因为在高工作负载WR消耗可用P / E周期快,和写错误影响整个错误严重而不是保留错误。

去年rb平均。

我们总结有罪的可靠性在图的收益 5。图的可靠性提高 5显示多少罪犯减少平均最后rb对公关方法(PR-day和公关周刊)相对。计算公式如下: (4) Avg 去年 rb 公关 Avg 去年 rb 有罪的 Avg 去年 rb 公关

可靠性改进PR-day和公关周刊。

工作负载在中低WR,罪犯可以提高可靠性的SSD屏蔽平均最高83%。工作负载高WR,罪犯没有显示效果,因为沉重的写错误。最好的结果,有罪的减少了误比特概率超过公关了 182.23 × 10 8 。考虑到典型的比特误码率 2.48 × 10 8 ( 13),有罪的展示了超过73倍改进公关。

5.2.2。重新映射成本

分析重新映射成本减少可用一生的SSD,我们把每一个额外的平均市盈率低,循环介质和高与PR-day WR工作负载,公关周刊和罪犯。即更多额外的P / E周期表明一生的损失。在图 6,我们可以看到CRIM-best只是最大的平均寿命损失0.67,它是最小的所有方法。这个结果表明,罪犯可以有效清除无条件调用数百个或多个重新映射操作(最大1824年和260年在PR-day业务和公关周刊)。注意,罪犯显示更好的终生收益图 3,这是它的原因。

重新映射的比较成本。

6。讨论

公关的艺术是Adaptive-rate货代建议( 12]。它具有相同的目标是有罪的但也有差异。因此,我们将讨论两个问题:什么是不同的点和罪犯的好处是什么。不幸的是,Adaptive-rate货代不是开源软件;因此,很难进行比较准确的罪犯在运行代码的水平。相反,我们试图比较罪犯的逻辑调整刷新时期Adaptive-rate货代。

6.1。共同和不同的点

通常,罪犯和Adaptive-rate货代有相同的目标,减轻刷新开销和提高寿命。显著差异是两个:刷新条件和粒度。当刷新调用刷新条件决定。刷新粒度表明准确调用刷新。

关于罪犯刷新状态,当SSD块失败是高度预测,刷新任务调用。罪犯通过预测模型预测屏蔽故障,根据预测的结果执行条件重新映射。在Adaptive-rate货代,刷新周期调整的刷新率,调用刷新操作。Adaptive-rate货代调整刷新频率从低到高P / E周期降低。

刷新有罪的粒度非常细粒度的尽量多写区间。罪犯的block-life-judge (BLJ)写请求时触发。不管之间的时间间隔长度写道,在下次写时间,BLJ决定了容易出错的状态考虑当前的误比特率和可用的P / E周期。刷新的粒度Adaptive-rate货代仅限于每天刷新的最高刷新率。Adaptive-rate货代可以改变的刷新率没有刷新每日刷新;它没有提供一个更精确的比每天的房费( 12]。

简而言之,罪犯可以缓和一些错误通过预测刷新写道,和Adaptive-rate货代,缓解了一些错误通过定期刷新调整利率。同时,罪犯提供了一个使用写的细粒度的刷新间隔,和Adaptive-rate货代提供了一个粗粒度的刷新(从每天刷新到没有刷新)而不是罪犯。

6.2。罪犯的好处

从上面的两个差异,罪犯有两个好处比Adaptive-rate货代。首先,罪犯可以处理更多的一些错误与细粒度的方式在现代操作系统比Adaptive-rate货代。从罪犯与Adaptive-rate货代,我们发现有一些错误Adaptive-rate货代无法处理。这些未处理的一些错误可以恶化现代操作系统的文件系统的一致性。现代操作系统之间保持一致性内存和磁盘上的文件系统的数据通常使用journaling-based文件系统(例如,Ext4 Linux和BSD日志结构文件系统(LFS))。这些文件系统定期生成许多写请求同步他们的期刊SSD存储在每个检查点(一个周期时间冲洗,通常秒:例如,在Linux Ext4(5秒 https://www.kernel.org/doc/Documentation/filesystems/ext4.txt))。因为每秒写入块可以发生,每秒比特误码率可以增加。然而,Adaptive-rate货代不能刷新他们因为其最低刷新率每日(24小时)。因为罪犯不会错过任何写道,一些错误写可以刷新时,预测一个容易出错的状态。

第二,罪犯可以延长寿命超过Adaptive-rate货代在现代操作系统。的刷新率Adaptive-rate货代增加可用的P / E周期减少。当最高每天刷新,Adaptive-rate货代调用刷新每24小时。如果刷新率日常,这意味着可用的P / E周期很低。然而,在24小时内,就会出现一些错误高概率。有些错误在低P / E可用周期产生一个屏蔽失败,然后确定其MTTF屏蔽故障时间。然而,罪犯可以处理一些错误无论时期;因此它可以扩展MTTF块因为罪犯已经重新映射它在前面写时间提前。

7所示。结论

ssd可以增强的可靠性是否定期重新映射(PR)块。然而,它有一个限制,公关造成额外的寿命损失。罪犯,我们提出一个新的方法以减少额外的生命损失,有条件地调用重新映射操作。在我们的实验中,我们表明,罪犯可以扩展一生的SSD公关多12.6%到17.9%的5年保修时间。同时,我们表明,罪犯可以减少一些错误概率的SSD 73倍的典型的比特误码率与公关相比。

附录 解决预期的保留时间方程

原始rb方程如下: (.) rb t , c = 9.991 × 10 10 c 1 + 1.0 × 10 9 + 4.485 × 10 4 × t 1.25

我们的目标是解决方程 rb t , c = 河口 t和目标方程如下: (a) 9.991 × 10 10 c 1 + 1.0 × 10 9 + 4.485 × 10 4 × t 1.25 = 河口

让我们定义 k r作为 (a) k = 9.991 × 10 10 c 1 + 1.0 × 10 9 , r = 4.485 × 10 4

然后,将原方程 (各) k + r t 1.25 = 河口

现在,我们解决这个问题 t下面的步骤。首先,减去 k相同的一面” = ”的牌子,我们得到的 (本) r t 1.25 = 河口 k

其次,分 r相同的一面” = ”标志;请注意, r不为零,我们得到了什么 (要求寄出) t 1.25 = 河口 k r

在这里,我们定义一个常量 p作为 p = 河口 k / r ,我们得到 (A.7) t 1.25 = p

接下来,我们应用对数与基础 e在同一边的 = ”的牌子,我们得到的 (如) 日志 t 1.25 = 日志 p

然后,我们得到 t通过安排指数方程如下: (A.9) 1.25 × 日志 t = 日志 p , 日志 t = 日志 p 1.25 , t = e 日志 p / 1.25

最后,我们得到预测 t方程代换的常数 k, r p如下: (A.10) t = e 日志 河口 9.991 × 10 10 c 1 + 1.0 × 10 9 / 4.4485 × 10 4 / 1.25

数据可用性

在这项研究中使用的数据可以利用的链接 https://github.com/saintgodkyp/CRIM或通讯作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究得到了MSIT(科技部和ICT),韩国,根据西南流动支持计划(IITP - 2018 - 2015 - 0 - 00280)和监督IITP(信息和通信技术促进研究所)。这项工作也在一定程度上支持IITP格兰特由韩国政府资助(MSIT)(没有。2015-0-00288,研究网络虚拟化平台和服务SDN 2.0实现)。这项工作也由高丽大学拨款支持。

Debnath b K。 森古普塔 年代。 J。 Chunkstash:加快内联使用闪存存储重复数据删除 USENIX学报》年度技术会议 2010年6月 波士顿,美国 Debnath B。 森古普塔 年代。 J。 Flashstore:高吞吐量持续的键值存储 美国养老 2010年 3 1 - 2 1414年 1425年 10.14778/1920841.1921015 Beloglazov 一个。 Buyya R。 y . C。 一个分类和节能的数据中心和云计算系统的调查 电脑的发展 2011年 82年 2 47 111年 10.1016 / b978 - 0 - 12 - 385512 - 1.00003 - 7 2 - s2.0 - 79952812919 Elzeiny 一个。 Elfetouh 答:一个。 利雅得 一个。 云存储:一项调查 国际新兴的趋势和技术在计算机科学杂志(IJETTCS) 2013年 2 4 342年 349年 Mielke N。 Marquart T。 N。 比特误码率在NAND闪存记忆 2008年IEEE国际可靠性物理学报》研讨会(2008年irp) 2008年5月 凤凰城,亚利桑那州,美国 IEEE 9 19 10.1109 / relphy.2008.4558857 2 - s2.0 - 51549114280 Yadgar G。 Yaakobi E。 舒斯特尔 一个。 编写一次,得到50%的自由:节省SSD消除成本使用蠕虫代码 学报》13日USENIX大会文件和存储技术(快速15) 2015年2月 美国加利福尼亚州圣克拉拉 257年 271年 Y。 Y。 N。 H。 Y。 弹性队列:一个普遍的SSD一生扩展插件缓存替换算法 学报》第九届ACM国际会议系统和存储 2016年6月 以色列海法 ACM 5 10.1145/2928275.2928286 2 - s2.0 - 84978920164 T。 年代。 公园 J。 J。 的有效生命周期管理SSD-based突袭使用dedup-assisted部分条纹写道 学报》2016年第5非易失性内存系统和应用研讨会(NVMSA) 2016年6月 IEEE 1 6 10.1109 / nvmsa.2016.7547184 2 - s2.0 - 84986592886 月亮 年代。 Reddy 一个。 raid提高固态硬盘阵列一生吗? ACM事务存储(TOS) 2016年 12 3 11 10.1145 / 2764915 2 - s2.0 - 84973320149 C。 Baskiyar 年代。 延长flash一生在二级存储 微处理器和微系统公司 2015年 39 3 167年 180年 10.1016 / j.micpro.2015.03.002 2 - s2.0 - 84925382171 Imai H。 错误控制编码技术的要点 2014年 美国剑桥,马 学术出版社 Y。 Yalcin G。 Mutlu O。 Flash correct-and-refresh: retention-aware错误管理增加闪存的一生 学报2012年IEEE 30日电脑设计国际会议(ICCD) 2012年9月 加拿大蒙特利尔 94年 101年 10.1109 / iccd.2012.6378623 2 - s2.0 - 84872091355 施罗德 B。 Lagisetty R。 商人 一个。 Flash可靠性在生产:预期和意想不到的 14日USENIX大会学报》上。文件和存储技术(快速的16) 2016年2月 美国加利福尼亚州圣克拉拉 67年 80年 奥尔森 a。R。 Langlois d . J。 固态硬盘数据的可靠性和寿命 怡敏信白皮书 2008年 1 27 Tanakamaru 年代。 C。 Esumi 一个。 伊藤 M。 K。 竹内 K。 95% -lower-ber 43%低功耗智能固态硬盘(SSD)与不对称编码和条纹图案消除算法 学报IEEE固态电路会议消化技术论文(globalfoundries) 2011年2月 旧金山,加州,美国 IEEE 204年 206年 10.1109 / ISSCC.2011.5746283 2 - s2.0 - 79955726617 R.-S。 C.-L。 W。 优化NAND flash的ssd通过保持放松 学报》10日USENIX大会文件和存储技术 2012年2月 美国加利福尼亚州圣何塞 USENIX协会 11 桑德拉让 G。 普拉巴卡兰 V。 巴拉科瑞斯南 M。 进程有 T。 延长SSD一生与基于磁盘写缓存 程序快速的10 2010年2月 美国加利福尼亚州圣何塞 101年 114年 巴拉科瑞斯南 M。 Kadav 一个。 普拉巴卡兰 V。 Malkhi D。 微分突袭:反思raid SSD的可靠性 ACM事务存储(TOS) 2010年 6 2 4 10.1145/1807060.1807061 2 - s2.0 - 77955197441 T.-Y。 威廉姆森 a。R。 Wesel r D。 增加闪存终身互信息的动态电压分配常数 学报2014年信息理论与应用研讨会(ITA) 2014年2月 IEEE 1 5 越南盾 G。 Y。 T。 使用lifetime-aware渐进编程来提高SLC NAND闪存写的耐力 IEEE超大规模集成电路(VLSI)系统 2014年 22 6 1270年 1280年 10.1109 / tvlsi.2013.2267753 2 - s2.0 - 84901594428 JSST协会 固态硬盘(SSD)需求和耐力测试方法 2016年 日本 电平标准,JESD218B.01 1 28 Kaese r·W。 闪存为SSD用户基础 学报OpenZFS欧洲会议 2015年6月 法国巴黎 OpenZFS 1 15 Hellerstein j·L。 Y。 帕尔克 年代。 蒂尔伯里 d . M。 计算系统的反馈控制 2004年 美国新泽西州霍博肯 约翰威利& Sons Tanakamaru 年代。 福田 M。 Higuchi K。 Post-manufacturing, 17次接受原始比特误码率提高,动态码字转换ECC方案高可靠固态硬盘,固态硬盘 固体电子学 2011年 58 1 2 10 10.1016 / j.sse.2010.11.025 2 - s2.0 - 79952283183 JSST协会 坏块管理NAND闪存记忆 圣微电子 瑞士日内瓦应用程序,一个1819年,页1 - 7,2004 阳极定流 C。 IEEE推荐的实践设计可靠的工业和商业电力系统 1991年 纽约,纽约,美国 IEEE