Szerző: Bodnár Ádám

2010. április 6. 11:59

Késik a Microsoft adattárháza

Frissült a Microsoft adattárház-szerverének technikai előzetese. A SQL Server 2008 R2 Parallel Data Warehouse-t az első félévre ígérték, de csak később jelenik meg.

A Microsoft kiadta a Windows Server 2008 R2 Parallel Data Warehouse utolsó technikai előzetesét (Community Technology Preview). Az adattárházakhoz szánt elosztott adatbázis megjelenését az első félévre ígérte a cég, a premiert azonban későbbre halasztották, hogy a lehető legtöbb visszajelzést gyűjtsék be a felhasználóktól. A végleges verzió megjelenési dátumát, a konfigurációkat és az árakat nyár elején hozzák nyilvánosságra.

Az Oracle Exadatához hasonlóan a Microsoft megoldása is egy szervereket, tárolókat, hálózati eszközöket és szoftvereket tartalmazó, előre integrált, gyárilag telepített és konfigurált \"készülék\" (appliance), amely néhány terabájttól egészen petabájtos méretű adattárházak kiszolgálására hivatott. A SQL Server 2008 R2-re alapozó megoldást még a DATAllegro nevű vállalat fejlesztette, amelyet a Microsoft 2008-ban vásárolt fel. Az Ultra Shared Nothing architektúrát még Linuxra és Ingres adatbázisra fejlesztette ki a DATAllegro, amelyet 2008-ban felvásárolt a Microsoft, ezt követően tértek át SQL Server használatára.

A SQL Server 2008 R2 Parallel Data Warehouse MPP (massively parallel processing) architektúrára épül, a tervezők szerint ez a megközelítés sokkal inkább alkalmas adattárházak futtatására mint az SMP (symmetric multi-processing), amelyen az OLTP feladatok érzik jól magukat. A különbség oka, hogy online tranzakciófeldolgozás esetén rendszerint egyszerű műveleteket kell extrém párhuzamossággal végrehajtani a lehető legnagyobb teljesítmény eléréséhez, míg adattárházak esetén a lekérdezések bonyolultak, összetettek és a felhasznált adattömeg is jóval nagyobb. Röviden: míg az online tranzakciókezelés jellemzően \"scale-up\" probléma, az adattárzáz inkább \"scale-out\".

A Microsoft SQL Server 2008 R2 Parallel Data Warehouse kettő vagy több rackben foglal helyet,   az egyik rackben van az irányító intelligencia, itt történik az adatok betöltése, a lekérdezések kezelése, a node-ok felügyelete, valamint az adatok mentése. A másik rackben vannak azok a szerverek és tárolók, amelyek az adatokat tartalmazzák és amelyek a lekérdezéseket ténylegesen végrehajtják. A lekérdezéseket végrehajtó szerverek SQL Server 2008 R2-t futtató kétutas, négymagos x86-os kiszolgálók, a tárolószerverek szintén. A compute node-okat Infiniband kapcsolja össze, a tárolók FC hálózatra csatlakoznak. Mindne compute node-hoz egy tároló node tartozik.

A Microsoft állítása szerint akár petabájtos méretig is skálázható a Parallel Data Warehouse, ehhez a felhasznált szerverek típusától függően elég sok rackre is szükség lehet. A vállalat egy 50 csomópontos, 320 processzormagot és 137 terabájt háttértárat felvonultató rendszerrel végzett teljesítményteszteket és azt találta, a legújabb CTP 45 százalékkal gyorsabb az elsőnél, bár konkrét mérési adatokat vagy eredményeket nem hozott nyilvánosságra. A PDW-re épülő konfigurációk több nagy szervergyártó (HP, IBM, Bull, stb.) kínálatában meg fognak jelenni.

A Parallel Data Warehouse technikai előzetese nem tölthető le, akit érdekel a termék és ki szeretné próbálni, az mdsontap@microsoft.com e-mail címre kell írnia.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról