Szerző: Bodnár Ádám

2010. április 22. 14:33

Automatikus tárolórétegezés az IBM-nél is

Néhány hónappal az EMC után automatikus tárolórétegezést vezetett be System Storage DS8700 berendezésében az IBM is, emellett további újdonságokkal jelentkezett adattárolási területen.

Automatikus tárolórétegezés

A tárolórétegezés lényege, hogy az adatok az elérési gyakoriságuknak és a szükséges hozzáférési sebességnek megfelelő teljesítményű meghajtókra kerüljenek. A legsűrűbben használt adatokat érdemes a legnagyobb teljesítményű diszkekre vagy akár SSD-kre mozgatni, a ritkábban használtakat pedig lassabb, olcsóbb lemezekre. A legtöbb szervezetnél a rétegezést kézzel végzik el a rendszergazdák, ha egyáltalán megteszik, mivel rendkívül aprólékos, időigényes folyamatról van szó.

Az IBM által bevezetett megoldás látszólag nem annyira átfogó mint az EMC által decemberben bejelentett FAST (Fully Automated Storage Tiering), mivel csak két szintet különböztet meg a rétegezésnél. Az IBM System Storage Easy Tier folyamatosan figyeli az adatelérési mintákat és a sűrűn használt adatokat az SSD-kre mozgatja (amennyiben vannak ilyenek az eszközben), a többit az eredeti helyén hagyja. Az IBM megoldása a bejelentés alapján nem annyira kifinomult mint az EMC-é, ettől függetlenül biztosítja a rétegezés automatizálását és az ezzel járó kényelmet és egyszerűséget, ráadásul a DS8700 felhasználói számára ingyenes frissítésként érkezik, szemben a FAST-tal, amely külön szoftverlicenc megvásárlását igényli.

Amiben az IBM megoldása egyelőre jobb az EMC-nél, az a granularitás. A legfelső kategóriás EMC tárolókban, a Symmetrix családban a FAST jelenleg csak LUN-onként képes mozgatni az adatokat a különböző tárolórétegek között, az IBM-nél a legkisebb adatméret az 1 gigabájtos \"virtuális kötet\". Az EMC az idei harmadik negyedévre ígéri a FAST következő, második verzióját, amely már blokkszintű granularitással végzi az automatikus tárolórétegezést. Az IBM ugyanakkor naponta egyszer végez áthelyezést, míg a FAST sűrűbben is megteheti ezt, beállítás függvényében.

Az adattárolókkal szemben támasztott két legfontosabb elvárás a nagy kapacitás és nagy teljesítmény, ezeket egyszerre kielégíteni sokszor pazarlás, mivel nem minden adat számára fontos a folyamatos gyors elérhetőség. Az Enterprise Strategy Group becslései szerint egy tipikus vállalati alkalmazás által használt adatok 80 százaléka csak \"pihen\", nagyon ritkán van rá szükség, ezeket érdemes levenni a gyors diszkekről és átmozgatni őket olcsóbb és kevesebbet fogyasztó SATA tárolókra. A fennmaradó 20 százalék negyede az, ami \"forró\" adat, azaz a legsűrűbben használt, ezeknek SSD-n a helye. A vállalati SSD-k a merevlemezekkel összevetve egy nagyságrenddel gyorsabbak és kevesebbet is fogyasztanak, cserébe az egységnyi kapacitásra vetített áruk is jóval magasabb. Az adatrétegezés azonban lehetővé teszi, hogy csak a legforróbb adatok kerüljenek SSD-kre a ritkán használtak pedig diszkeken maradjanak.

Rétegezés bevezetése előtt érdemes lehet használni a szintén új DS8000 Storage Tier Advisor szoftvert, amely elemzi az adateléréseket és javaslatokat tesz, melyik köteteket érdemes Easy Tier segítségével SSD-re mozgatni. Az IBM szerint azoknak is érdemes elvégezniük egy ilyen elemzést, akik nem használnak SSD-ket a tárolóikban, mivel ennek segítségével hozzávetőleges képet kaphatnak arról,  profitálhatnak-e egyáltalán a méregdrága flash meghajtók képességeiből. Az elemzőeszköz emellett alkalmas arra, hogy megelőzze a feleslegesen sok SSD vásárlását, mivel segítségével eldönthető, valójában mennyi adatot érdemes SSD-re mozgatni.

További újdonságok adattárolási területen

A Nagy Kék emellett új termékekkel jelentkezett strukturálatlan adatok (pl. videók, képek) hosszú távú megőrzésére, az IBM Long Term File Systemmel, valamint ötödik generációs LTO Ultrium szalagos egységekkel. Az LTO-5 Ultrium szalagok 1,5 terabájt nyers vagy 3 terabájt tömörített kapacitást biztosítanak, ami kétszerese a korábbi generációs szalagokénak. A Long Term File System segítségével fájlrendszer-szinten lehet hozzáférni az LTO-5 szalagon tárolt strukturálatlan adatokhoz. Az IBM ezt a megoldást elsősorban olyan felhasználóknak ajánlja, ahol hatalmas mennyiségű médiafájl hosszú távú megőrzésére van szükség, ezek között található például a média és szórakoztatóipar, illetve az egészségügy.

ProtecTIER deduplikációs berendezéseiben is új képességet vezetett be az IBM, a \"many-to-one\" replikáció lehetővé teszi akár több adatközpont vagy vállalati telephely backup adatainak központi deduplikációját és mentését. A Tivoli Storage Manager legújabb verziójáról is elérhetők már a ProtecTIER-en tárolt adatok.

Megújult az XIV tároló is, amely tömeghardver és okos szoftver kombinációját használja: az XIV lényegében egy x86-os szerverekből álló fürt, ahol a csomópontok nem adatfeldolgozásra, hanem adattárolásra vannak kihegyezve, ezért annyi SATA merevlemez kerül beléjük amennyi csak lehetséges. Ezek azonban nem RAID-tömbökbe vannak szervezve: a tárolandó adatokat az XIV szoftvere 1 megabájtos darabokra szeleteli, és ezeket egyenletesen szétteríti a diszkeken, a legnagyobb teljesítmény és adatbiztonság érdekében. Az új XIV már 2 terabájtos diszkekkek érkezik, és alacsonyabb fogyasztású processzorokat is kapott, így az egységnyi kapacitásra vetített energiaigény kevesebb mint fele az előző változaténak.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról