Szerző: Asztalos Olivér

2016. március 8. 13:55

Új adatok az SSD-k megbízhatóságáról

Komoly tanulmányt készített az SSD-kről a Google. A vállalat adatközpontjaiból hat év alatt összegyűjtött statisztika többek között abba is betekintést nyújt, hogy mennyivel megbízhatóbb az SLC az MLC NAND-oknál.

Hat évnyi SSD-s tapasztalatát osztotta meg a nagyközönséggel a Google. A vállalat a FAST 2016 konferencián publikált tanulmánya adatközpontos, tehát nem csak valós, de intenzív használat szemszögéből vizsgálja a flash-alapú meghajtók viselkedését összesen 10 különböző, kifejezetten a Google számára készített SSD modellel. A meghajtók között MLC, eMLC, és SLC NAND-dal szerelt variánsok is voltak, így a különböző technológiákról immár összehasonlító adatok is rendelkezsére állnak. A 15 oldalas dokumentum számos érdekességgel szolgál, többek között az is kiderült, hogy a papíron messze a leghosszabb élettartammal kecsegtető SLC NAND-ok bizonyos esetekben nem feltétlenül megbízhatóbbak az MLC-s társaiknál.

Toxikus vezetők szivárványa

Az IT munkakörülményeket, a munkahelyi kultúrát alapjaiban határozzák meg a vezetők, főleg ha még toxikusak is.

Toxikus vezetők szivárványa Az IT munkakörülményeket, a munkahelyi kultúrát alapjaiban határozzák meg a vezetők, főleg ha még toxikusak is.

A Google többek között azt is vizsgálta, hogy a gyártók által specifikált egyes, a megbízhatóságra vonatkozó értékek hogyan viszonyulnak a valós felhasználás során tapasztalt adatokhoz. Az előzetes elvárásokkal ellentétben az RBER (raw bit error rates) a cellák fáradásával párhuzamosan csupán kisebb mértékben növekedett, miközben a javíthatatlan hibákra nem nyújtott megfelelő prognózist. Az UBER (uncorrectable bit error rate) szintén nem bizonyult megbízható mutatónak, az érték nem korrelált az olvasási műveletek és a javíthatatlan hibák számával.

A Google statisztikái szerint meglehetősen nagy esély van a rossz blokkok kialakulására, az SSD-k 30-80 százalékánál jött elő a probléma. Pozitívum, hogy modelltől függően az ilyen blokkok mediánja csupán 2-4, ugyanakkor ha egy meghajtónál már egyszer jelentkezett a probléma, akkor 50 százalékra nő az esélye annak, hogy idővel újabb blokkok romlanak el, akár 100 számra. Az adatok szerint MLC NAND-oknál két problémás blokk után nagyobb mértékben nőttek a hibás egységek mint az SLC-s modelleknél. A 100-as nagyságrendű hibaszám pedig a legtöbb esetben chip hibára utal. Érdekesség, hogy a Google szerint a blokkhibák jellemzően inkább olvasás során látnak napvilágot.

A tanulmány megjegyzi, hogy a merevlemezekhez hasonlóan az SSD-ket is rossz blokkokkal szállítják, melyeket a gyártás során zárnak ki az elérhető tárterületből. Az SLC-s meghajtóknál ezek mediánja 100 alatti, az MLC-s meghajtóknál pedig az érték 800 körül alakul. A Google szerint ezek száma szoros összefüggésben áll a megbízhatósággal, a statisztikák alapján minél több rossz blokkal érkezik a meghajtó, annál nagyobb az esélye annak, hogy ezek száma gyarapodni fog, ráadásul ezek a meghajtók az olvasási hibára is hajlamosabbak.

Amennyiben az egy chipben található blokkok több mint 5 százalékát rossznak minősíti a vezérlés, úgy jellemzően a teljes chip használhatatlanná válik. Amennyiben az SSD tartalmaz dedikált tartalék chipet, úgy az adat ebbe kerül át, ellenkező esetben a kizárt hibás chip kapacitásával csökken a meghajtó által kínált tárhely.

A Google vizsgálata szerint az használat első négy évében a meghajtók 2-7 százalékánál
romlott el egy teljes NAND chip. Az adatnál jóval nagyobb jelentőségű, hogy az érintett SSD-k specifikációiban megadott maximális programozási-törlési (PE) ciklus eléréséig csupán 2 százalékos blokkhibát ígérnek a gyártók, gyakorlatban viszont a meghajtók kétharmada produkált 5 százalék feletti értéket.

A vizsgált tíz különféle SSD közül a két eMLC-s (enterprise MLC), illetve az SLC-C jelölésű meghajtótípus bizonyult a legmegbízhatóbbnak. Ismétlésképp: az SLC cellánként egyetlen bitet, míg az MLC két bitet tárol, ami dupla nyers kapacitást, de elvben alacsonyabb megbizhatóságot hoz. A sztenderd MLC ebben a tekintetben egyértelműen gyengébbnek bizonyult, ugyanakkor ez az arány nincs összhangban a végzetes problémákkal, a meghajtók közül az SLC-B és SLC-C típusból kellett a legtöbbet javítani, cserére pedig az SLC-B modell szorult a legnagyobb százalékban. Ez tehát egyáltalán nem igazolja vissza az SLC-MLC különbség megbízhatóságra vonatkozó tételét - ez az elemzés talán legmeglepőbb következtetése.

A Google-nek merevlemezek terén is óriási tapasztalata van, a vállalat továbbra is hosszútávon számol a mechanikus tárolókkal, a cég ezért röviden összevetette az SSD-kkel és a HDD-kkel szerzet tapasztalatait is. A vállalatnál évente a merevlemezek 2-9 százaléka szorul cserére, miközben SSD-kből négy év alatt 4-10 százalékot cserélt a Google, tehát itt a flash-alapú meghajtó vezet.

A különféle műveleti hibák tekintetében fordított a felállás, a vizsgált meghajtók 20 százaléka jelentkezett valamilyen javíthatatlan hibával a négy év során, és 30-80 százalékuknál fejlődött ki hibás szektor, 2-7 százalékuknál pedig egy teljes NAND chip is csődöt mondott. Ezzel szemben három év alatt csupán a merevlemezek 3,5 százalékánál jelentkeztek rossz szektorok, ami lényegesen kedvezőbb. Összefoglalva: az SSD-k bár kevesebbszer szorultak cserére, a HDD-k esetében jóval ritkábban jelentkeztek (a meghajtón belül) javíthatatlan adathibák.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról