Mellékleteink: HUP | Gamekapocs
Keres

Egységes infrastruktúrát kap az SQL és a Hadoop

Gálffy Csaba, 2011. szeptember 22. 13:08
Ez a cikk több évvel ezelőtt születetett, ezért előfordulhat, hogy a tartalma már elavult.
Frissebb anyagokat találhatsz a keresőnk segítségével:

Azonos szekrényekbe pakolhatóak a strukturálatlan és strukturált adatok az új EMC Greenplum DCA rendszerrel.

Az EMC bemutatta Modular Data Computing Appliance névre keresztelt új rendszerét, amely képes egységes infrastruktúrát kínálni a relációs adatbázisok és a strukturálatlan adatokat tartalmazó Apache Hadoop adatbázisok számára is.

Felületkezelés

A Modular DCA szekrényébe négy modul illeszthető, ezek lehetnek a szokásos Greenplum Database Module-ok (Standard illetve nagy kapacitású változatban), de lehetnek Hadoopot futtató Greenplum HD modulok is. A rack fogad ezen felül Data Integration Accelerator (DIA) egységeket is, amelyeken a partnerek alkalmazásai futnak. A rendszer képes az egységeket minden kombinációban fogadni - ebben azonban ki is merül a különböző adatstruktúrák egyesítése.

A közös tárolószekrényeken kívül ugyanis a kétféle, SQL-alapú és Hadoop-alapú adatbázis-rendszer között nincs átjárás, így a Modular DCA semmilyen szinten nem képes összeolvasztani a két forrásból származó adatokat - erről az analitikára használt eszközöknek kell gondoskodniuk. Az egységes infrastruktúrának természetesen vannak előnyei, az egy felületről üzemeltethető, azonos platformon futó rendszerek jelentős költségcsökkentést hozhatnak.

Bár az egyes versenytársak (például a Teradata által felvásárolt Aster Data) már képesek a különböző adatok közötti határ elmosására, az EMC megoldása erre egyelőre nem képes. Ugyan a közös platformra hozott rendszerek már a jó irányba tett lépésként értékelhetőek, a gyártó által hangoztatott teljes integráció még messze van. A Hadoopot nagy tételben használó szervezetek számára kérdéses marad, hogy az ilyen rendszerekhez tipikusan használt tömeghardverrel az EMC árban fel tudja-e venni a versenyt, illetve a kínált előnyök felül tudják-e írni az esetleg számottevően magasabb árat.

Workbench - tesztelésre

Az appliance-szel egyi dőben egy Greenplum Analytics Workbench nevű hosting szolgáltatást is bemutatott az EMC. A több mint ezer node-ból álló rendszert a Hadoop nyílt forráskódú fejlesztői közösség rendelkezésére bocsátják, tesztelésre. Az EMC várakozásai szerint a Workbench segítségével felgyorsulhat a Hadoop fejlesztése, stabilabbak lehetnek a kiadások - nem mellékesen pedig a közösség az EMC termékeire is optimalizálhatja a szoftvert. A most bemutatott Modular DCA a minőségbiztosítás utolsó fázisában van, általánosan az év végére lesz elérhető.

Facebook

Mit gondolsz? Mondd el!

Adatvédelmi okokból az adott hír megosztása előtt mindig aktiválnod kell a gombot! Ezzel a megoldással harmadik fél nem tudja nyomon követni a tevékenységedet a HWSW-n, ez pedig közös érdekünk.