Szerző: Bodnár Ádám

2014. július 16. 12:36

Oracle: big data feldolgozás SQL-lel

Az Oracle a Database 12c júliusi frissítésében megjelenő in-memoryval egyesítette a hagyományos, diszkalapú tranzakciókezelési feladatokat és a memóriában történő analitikai feldolgozást, hogy megvédje piacát az olyan új belépőktől mint amilyen az SAP. Most egy hasonló lépéssel a rivális "big data" platformok ellen indul harcba a cég.

Az IT-ipar egyik legfelkapottabb buzzwordjének számító "big data" azokat a feladatokat fedi le, amikor hatalmas mennyiségű, jobbára strukturálatlan adatból kell egy szervezet számára releváns információkat kinyerni. Az iparágban számos olyan megoldás terjedt el ma már, amelyet kifejezetten nagy mennyiségű (strukturálatlan) adat tárolására és feldolgozására hozta létre, ilyen például a terület de facto szabványának számító Hadoop vagy a változatos NoSQL-implementációk. Ezek nem relációs adatbázisok, logikailag is teljesen elkülönülnek az előbbiektől, a hatékony feldolgozáshoz pedig szükség van kompetens adminokra és fejlesztőkre. "Hiány van jó Hadoop-programozókból, ezért sok szervezet nem tudja kiaknázni a Hadoop előnyeit. A költségek vagy a biztonsági kockázatok miatt pedig nem mindig lehet minden adatot egyetlen adattárba mozgatni" - érvel a piros logós cég.

Big data feldolgozás SQL-lel

Kedden az Oracle ezért bejelentette a Big Data SQL nevű termékét, amelynek célja, hogy "közös nyelvet" képezzen a tranzakciófeldolgozásra használt adatbázisok és a változatos "big data" platformok között.  Az Oracle most bemutatott terméke utóbbiak fölé húz egy olyan ernyőt, amely lehetővé teszi az adatbázis-adminok számára hogy az általuk amúgy is ismert SQL nyelven írjanak lekérdezéseket nem relációs adatbázisokra vagy Hadoopra. "Azt az Oracle SQL dialektust használhatjuk, amelyet eddig is használtunk és közvetlenül érhetjük el ezeket az adatforrásokat vagy ezek bármilyen kombinációját" - magyarázta Neil Mendelson, a vállalat big data és analitikai termékekért felelős vezetője.

A Big Data SQL feladata, hogy ezeket a technológiákat "egyenrangú állampolgárként" kezelje és a felhasználó szervezetek kezébe olyan eszközt adjon, amelynek birtokában azok a legtöbbet hozhatják ki belőlük anélkül, hogy át kellene képezni az adminjaikat és fejlesztőiket vagy vadonatújakat kelljen felvenniük. Ahelyett, hogy a "big data" rendszerek új silókat alkotnának a vállalati IT-infrastruktúrában, a Big Data SQL segítségével szervesen integrálhatók a többi adattárral és lehetővé teszi olyan lekérdezések gyors futtatását, amely kiterjed a relációs adatbázisban levő tranzakciókra és a strukturálatlan adatokra egyaránt (pl. milyen hatással vannak az értékesítésre egy adott országban a Twitteren terjedő kritikák).

Toxikus vezetők szivárványa

Az IT munkakörülményeket, a munkahelyi kultúrát alapjaiban határozzák meg a vezetők, főleg ha még toxikusak is.

Toxikus vezetők szivárványa Az IT munkakörülményeket, a munkahelyi kultúrát alapjaiban határozzák meg a vezetők, főleg ha még toxikusak is.

Ez a felismerés persze nem új, az Oracle előtt már másoknak is eszébe jutott "SQL-re tanítani" a big data rendszereket, egy ilyen nyílt forrású projekt például a Hadoophoz írt Stinger, a Cassandra Query Language (CQL) pedig a NoSQL adatbázisokon végzi el ugyanezt. Az Oracle Big Data SQL természetesen nem nyílt forrású és kezdetben csak Apache Hive-ot és Hadoop File Systemet támogat, de később további technológiák (pl. MongoDB, HBase, Oracle NoSQL DB) is bevonhatók az ernyője alá.

Kölcsönvett technológiák

A Big Data SQL egyébként az Exadatától veszi kölcsön a Smart Scan technológiát: a SQL lekérdezések az adatok elhelyezkedéséhez a legközelebb futnak le és a felhasználó csak a számára releváns adatokat kapja vissza. A kevesebb adatmozgatás az Oracle szerint magasabb teljesítménnyel jár, ami különösen fontos abban az esetben, ha hatalmas mennyiségű adatot kell átfésülni. A cég úgy becsli, a Smart Scannel az adatmozgatás 99 százalékát megspórolja. Egy másik fontos jellemzője a Big Data SQL-nek, hogy az Oracle Database-ből megörökölt számos biztonsági képességet, például a jogosultságkezelést vagy a data redactiont - utóbbi érzékeny adatok "eltüntetésére" szolgál, kitakarhatók akár komplett oszlopok egy adatbázisban, vagy azok részei, illetve véletlen adatokkal is helyettesíthetők a feldolgozás során.

A Big Data SQL a harmadik negyedévben válik elérhetővé, ára egyelőre nem ismert.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról